金融決済の“行動パターン”をAIが学習する時代へ──NVIDIAが取引基盤モデルの構築手法を公開
クレジットカードの利用履歴や送金のたびに蓄積される取引データは、人の行動を映し出す鏡だ。しかし多くの金融機関では、不正検知や与信判断を人手で設計したルールや静的な特徴量に頼ってきた。NVIDI
読む →基盤モデルを理解するための重要テーマ。
基盤モデルを理解するための重要テーマ。
基盤モデルを理解するための重要テーマ。
基盤モデルを理解するための重要テーマ。
Latest Articles
クレジットカードの利用履歴や送金のたびに蓄積される取引データは、人の行動を映し出す鏡だ。しかし多くの金融機関では、不正検知や与信判断を人手で設計したルールや静的な特徴量に頼ってきた。NVIDI
読む →
病院や診療現場で使われる音声AIにとって、薬剤名や解剖学用語を正確に認識することは想像以上に難しい。「アセトアミノフェン」「アムロジピン」「セファゾリン」といった薬の名前は、日常会話にほとんど
読む →
OpenAIは2026年6月18日、無料版ChatGPTに提供されているGPT-5.5 Instantが、健康・ウェルネス領域で大幅な応答性能向上を達成したと発表した。医師が設計した評価基準に
読む →
製薬業界で長年使われてきた化学反応の収率を、AIが自律的に実験を繰り返して引き上げる成果が明らかになった。OpenAIとMolecule.oneの研究チームは、最新モデル「GPT‑5.4」と自
読む →
子どもの希少遺伝性疾患をめぐる診断プロセスが変わり始めている。専門医による長年の解析でも原因が特定できなかった症例に対し、AIの高度な推論能力を組み合わせることで、新たに18件の診断が確定した
読む →
大規模言語モデルが常時稼働し、自律的に推論・判断する「エージェントAI」への移行が本格化している。この変化の裏で、膨大な計算を支えるインフラの再設計が静かに進行中だ。クラウド事業者CoreWe
読む →
これまでChatGPTは、ユーザーが明示的に「覚えておいて」と指示した情報だけを断片的に保持していた。しかし今回の更新で、過去のすべての会話履歴を参照し、そこから最新かつ適切な文脈を自動的に合
読む →
AIモデルの性能を測る指標は、単なる「賢さ」から「コストあたりの処理速度」へと重心を移している。この変化を象徴する出来事として、AI推論サービスを提供するCoreWeaveが、Moonshot
読む →
この記事を一言でいうと 住宅ローンに必要な「権原調査」の業務を、AIエージェントが州法や郡ごとの細かいルールを横断検索しながら支援する仕組みが稼働し始めた。 なぜ話題なのか 米国で住宅ローンを
読む →
NVIDIAが2026年5月、大規模な合成3D医療画像生成の成果を公開した。量・質ともに実用的な合成CTやMRIを生成し、そのデータで事前学習させた医療AIモデルを業界に提供する計画である。背
読む →
OpenAIのフロンティアモデルと、ソフトウェア開発エージェント「Codex」が、Amazon Web Services(AWS)上で一般利用可能になった。これにより、既にAWSを業務基盤とし
読む →
Anthropicは2026年5月28日、最上位モデルの新バージョン「Claude Opus 4.8」を発表した。今回の更新で注目すべきは、単なる性能向上ではなく、人間とAIが長時間にわたって
読む →企業がAIを業務に組み込む動きが加速するなか、クロード(Claude)を手がけるAnthropicが、導入支援を担うパートナー企業の実力を外から見えやすくする仕組みを導入した。パートナー企業を
読む →
通信事業者がNVIDIA Cloud Partnerのリファレンスアーキテクチャに基づくAI工場を建設し、そこからトークンベースの課金モデルでAIサービスを提供する動きが具体化している。インド
読む →
金融機関におけるAI活用が、業務効率化の道具から「組織とサービスの根幹を変える存在」へ移行し始めている。三菱UFJフィナンシャル・グループ(MUFG)が、OpenAIの「ChatGPT Ent
読む →
企業のERPやCRM、データベースに眠る膨大な表形式データ。その分析に3〜6カ月もの時間と専門チームを要していた現場へ、事前学習済みの専用基盤モデルがクラウド上で直接使えるようになった。Ama
読む →
銀行のサービスは、これまで「支店に行く」「アプリを開く」「電話をかける」といった能動的な行動から始まるのが当たり前だった。だが、スペイン発のグローバル金融機関BBVAがOpenAIと結んだ戦略
読む →大規模言語モデルの調整手法として知られる「直接選好最適化(DPO)」が、チャットボットの対話品質向上以外の領域で明確な効果を示した。ブラジルポルトガル語のOCR(光学文字認識)タスクにおいて、
読む →
OpenAIがライフサイエンス専用モデル「GPT‑Rosalind」の機能拡張を発表した。従来の言語モデルが苦手としてきた創薬やゲノム解析の現場で、実用的な性能を示す評価基準を独自に整備し、研
読む →
この記事を一言でいうと AWSが、大規模言語モデル(LLM)の応答速度を飛躍的に高める新技術「P-EAGLE」の導入手順を公開した。従来の逐次処理のボトルネックを解消し、より深い「先読み」を一
読む →
米国の技術開発企業Andon Labsは、複数の生成AIモデルに人間の介入なしで事業運営を任せる実験を継続している。その最新プロジェクトとして、4つのAIモデルにそれぞれラジオ局を運営させた結
読む →
AIによるプログラミング支援の世界で、「長く複雑な作業をどれだけ正確にこなせるか」という新たな競争軸が鮮明になってきた。xAIは2026年6月1日、対話型AI「Grok Build」上で新モデ
読む →
生物学の研究や創薬に特化した対話型AI「GPT‑Rosalind」を、OpenAIが2026年4月に正式発表した。同モデルは基礎生物学からトランスレーショナル医療までを対象とし、5月にはバイオ
読む →個人や企業の端末で動作するローカルAI実行環境「Ollama」が、大規模言語モデル(LLM)の推論サーバーとの通信において、無通信時に送信される特定の信号を正しく無視するように修正を加えた。こ
読む →
大企業がChatGPTを全社導入する際の最大の壁は「コストの不透明さ」だった。OpenAIは2026年6月18日、法人向けプラン「ChatGPT Enterprise」にクレジット使用量の分析
読む →小型の言語モデルだけで複数のAIエージェントを動かし、物々交換から格差の広がりまでを自律的に発生させる実験が公開された。大規模モデルではコスト的に難しい「多数のAIが同時に考え続ける」仕組みを
読む →Open WebUIのv0.9.0リリースは、大規模言語モデル(LLM)を利用するためのユーザーインターフェースが、ブラウザの枠を超えてOSネイティブの実行環境へと進化したことを示している。同
読む →Open WebUIのバージョン0.8.9が公開され、内蔵ターミナル「Open Terminal」に7つの新機能が追加された。この更新の本質は、ブラウザ上で完結する統合開発環境の実現にある。J
読む →
この記事を一言でいうと セキュリティの前提が「日単位のパッチ適用」から「時間単位の自動修復」へ変わり、AIクラウドを選ぶ企業には新たな基準が求められている。 なぜ話題なのか OpenBSDとい
読む →llama.cppの推論基盤がマルチトークン予測を整理、「動画・音声の同時処理」にらむ再設計の意味 対話型AIをパソコンやスマートフォンで動かすための軽量実行環境「llama.cpp」に、次世
読む →
デリバリーアプリを開く前に、自分が欲しい商品がすでにカートに入っている。GopuffとSpaceXAIが発表したAIショッピングアシスタント「Go」は、そんな先回り型の購買体験を現実のものにし
読む →自律的に動く複数のAIをチームのように連携させるフレームワーク「CrewAI」が、新たなプレリリース版を公開した。今回の更新は大規模な機能追加というより、開発基盤の安定性を高める布石である。し
読む →
企業向けAIの現場で、最も厄介な問題の一つが「幻覚(ハルシネーション)」だ。AIが自信満々に誤情報を出力してしまうこの課題に対し、xAIの最新モデル「Grok 4.3」が具体的な数値で回答を突
読む →ローカル環境で大規模言語モデル(LLM)を動かすOllamaに、最新バージョンv0.30.4がリリースされた。今回の更新で、中国のMoonshot AIが開発した「Kimi-K2.6」や、清華
読む →
AIモデルを本番環境で提供する際、アクセス集中に応じてサーバーを増強する「スケールアウト」の遅さは、ユーザー体験を損なう重大な課題だった。Amazon SageMaker AIが新たに導入した
読む →大規模言語モデル(LLM)を高速に動かす推論エンジン「vLLM」の開発チームは、自動テスト中に処理が止まってしまう問題を自動的に検出し、原因を即座に特定できる仕組みを導入した。LLMを本番環境
読む →生成AIを自社のシステムに組み込むための代表的なフレームワーク「LangChain」が、バージョン1.3.1へとマイナーアップデートされた。今回の更新で最も注目すべき点は、Amazon Bed
読む →
AIの信頼性を根幹で支えるソフトウェアサプライチェーンに、米国国立標準技術研究所(NIST)が大きな修正を加えた。Special Publication 800-53の第5版リビジョン5.1.
読む →マイクロソフトのマルチエージェントフレームワーク「AutoGen」の最新バージョンv0.7.5が公開された。今回のアップデートは単なるバグ修正の集合に見えるが、実はAI開発におけるインフラ層・
読む →
生成AIがコードを数時間かけて書き続ける——そんな「長期タスク」が現実になろうとしている。中国Z.AIが発表した大規模言語モデル「GLM-5.2」は、100万トークンの文脈を安定的に扱いながら
読む →
短尺動画の制作スピードがほぼ2倍になり、映像・音声・物理演算が一度に生成されるようになった。クリエイティブの試作と実制作の境界が、またひとつ消えようとしている。 この記事を一言でいうと xAI
読む →llama.cppの開発リポジトリに、炭素原子の並びではなくDNA塩基配列を直接処理できる新トークナイザーがマージされた。HuggingFaceBioが公開するCarbonシリーズの3Bモデル
読む →
企業がすでに抱えるクラウド契約の枠組みのなかで、OpenAIの先端モデルや開発支援サービス「Codex」を利用できるようにする取り組みが動き出す。OpenAIとOracleは、Oracle C
読む →クアルコムのエンジニアが主導し、AI推論フレームワーク「llama.cpp」にHexagon DSP向けのPAD演算カーネルが追加された。この変更は、モバイルやエッジデバイス上の大規模言語モデ
読む →
生成AIをビジネスで使いたい企業にとって、いま大きな壁となっているのが「モデルにアクセスできない」「処理待ちが発生する」という現実だ。とりわけEU圏では、データ保護規則(GDPR)に対応しなが
読む →llama.cppの最新ビルドb9263で、騰訊(テンセント)系のHunyuanVLとHunyuanOCRが単一パスに統合された。この変更は、視覚言語モデルにおける推論エンジン側の無駄な分岐を
読む →LangChainのOpenAI統合パッケージがバージョン1.2.2へと更新された。このリリースは、一見すると定期的なパッチ適用に見えるが、その内実はLLMアプリケーションを支える「仲介層」の
読む →
視覚言語モデル評価に特化した新指標登場の背景 AIによる画像キャプション生成や表解析の需要は小売から金融まで急速に拡大している。しかし生成テキストが画像の事実に即しているかを判定する評価手法は
読む →
AI開発のインフラ選択において、最終的な意思決定権を持つのはクラウド上で動くアプリケーションの担い手である。Amazon Bedrockの顧客データから、エンタープライズ規模でのモデル採用構造
読む →
金融サービス分野で、人工知能の商用導入が現実の収益に結びつく局面に入った。2025年6月、データ分析企業パランティア・テクノロジーズと金融サービスグループのTWGは、AIプラットフォーム「AI
読む →
AIの精度を上げるには良質なデータが欠かせない。しかし医療画像、金融取引記録、工場の検査データなど、最も価値の高いデータほど「外に出せない」制約がある。このジレンマに対し、NVIDIAのオープ
読む →vLLMプロジェクトは2025年5月、バージョン0.20.1を公開した。今回のリリースはDeepSeek V4シリーズの安定化と性能最適化に焦点を絞ったパッチであり、15件を超える修正が単一モ
読む →AIアプリケーションを支える開発フレームワーク「LangChain」の最新バージョン1.3.4が公開された。今回の更新は大きな機能追加ではなく、AIエージェントが人間に判断を求める際の「拒否」
読む →Microsoft傘下のAIエージェントフレームワーク「AutoGen」が、バージョン0.7.3をリリースした。今回のアップデートは単なるバグ修正ではない。OpenAIの最新モデル「GPT-5
読む →
金融機関は長年、不正検知、与信、レコメンド、リスク管理といった領域ごとに専用AIを構築してきた。この「タスク特化型モデル」の乱立は一定の成果を上げたが、いま制度疲労を起こしつつある。データもシ
読む →
Elon Muskが率いるAI企業xAIは、宇宙開発企業SpaceXと大規模な技術提携に入った。この動きの本質は、単なる同一経営者傘下の企業間連携ではない。AI開発における計算資源の垂直統合と
読む →
Googleが法人向け会議室デバイス「Google Beam」に新たな実験的機能を追加した。この実験では、会議室内の2名とオンライン参加者3名による小規模ミーティングを想定し、映像と音声の処理
読む →AIエージェント開発の主要フレームワークであるpyautogenがバージョン0.10.0のパッケージ公開基盤を整備した。今回の変更はPyPIへの公式パブリッシング設定が本番適用された初回リリー
読む →
文書AIの“誤抽出”が数分で改善、Amazon Bedrockの新機能が示す、人の手を介さない業務自動化の次なる競争軸 この記事を一言でいうと Amazon Bedrock Data Auto
読む →
「最高性能」と銘打たれた新たな大規模言語モデルがクラウド上で稼働を始めた。AnthropicのClaude Opus 4.8がAmazon Bedrockで利用可能になったという発表は、一見す
読む →LangChainの最新バージョン1.3.10が公開された。今回のリリースは、派手な新機能追加ではない。暗号ライブラリの更新や、OpenAIのGPT-5系モデルへの対応修正といった「縁の下の保
読む →大規模言語モデル(LLM)の推論エンジンとして注目を集めるオープンソースプロジェクト「vLLM」が、バージョン0.22.1のリリース候補版を公開した。今回の更新では、Dockerイメージのビル
読む →オープンソースの大規模言語モデル(LLM)推論エンジン「vLLM」が、次世代モデル「DeepSeek-V4」の初期化時に発生していたCUTLASSライブラリとの互換性問題を解決した。この修正は
読む →AIを社内導入する企業が増えるなか、ローカル環境やプライベートクラウドで動作するLLMフロントエンドのセキュリティ設計が急速に重要性を増している。2025年7月に公開されたOpen WebUI
読む →大規模言語モデル(LLM)を実用的な速度で動かすには、モデルの「軽量化」が欠かせない。この軽量化処理の中核を担う「imatrix(重要度行列)」の読み込みコードが重複している問題に対し、単一の
読む →エージェント開発を支えるフレームワーク「LangChain」の中核ライブラリ「langchain-core」がバージョン1.4.6へと更新された。今回の変更は、一見すると小規模なリリースに見え
読む →
身体性を持つAIエージェントが、クラウドに依存せず現場で判断し動く時代が近づいている。NVIDIAが公開した最新の開発キットは、ロボットや自律機械の頭脳を小型デバイス上で効率的に動かすための基
読む →ローカルLLM推論のデファクトスタンダードであるllama.cppに、マルチトークン予測を可能にするMTP(Multi-Token Prediction)サポートがマージされた。GitHubの
読む →llama.cppプロジェクトのビルドb9235がリリースされた。今回の更新は、大規模言語モデルの推論速度を左右する投機的復号の仕組みを大幅に再編し、特にMTP(Multi-Token Pre
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」において、保存・読み込み機能がサンプルコードから正式なテスト体系へと移行された。これは単なるファイル配置の変更ではなく、推論エ
読む →大規模言語モデル(LLM)を個人のパソコンやスマートフォンで動かすための代表的なオープンソース基盤「llama.cpp」の新たなビルド(b9441)が公開された。今回の更新では、Microso
読む →韓国LGグループのAI研究組織が開発した大規模言語モデル「EXAONE 4.5」が、オープンソースの推論フレームワーク「llama.cpp」に正式対応した。画像とテキストを同時に扱うマルチモー
読む →Python向け大規模言語モデル(LLM)アプリケーション開発フレームワーク「LangChain」の安定版パッケージであるlangchain-classicが、バージョン1.0.8へと更新され
読む →
自動運転の開発現場では、学習したモデルを実車に載せて走らせると、訓練時には見えなかった「ズレ」が次々と表面化する。この訓練と実環境のギャップをどう埋めるかが長年の課題だった。NVIDIAが公開
読む →
企業のITシステムが複雑化する中、障害を人が見張り続ける運用体制は限界に近づいている。AWSはこの課題に対し、Amazon Bedrock上で動作する自律型AI運用ソリューション「Amazon
読む →
2026年は世界人口の半数以上にあたる約40億人が投票権を持つ国に住む選挙イヤーである。この未曾有の民主主義集中年を前に、Googleは選挙関連の情報保護策とAI透明性強化に向けた複数施策の段
読む →
ロボットが目の前のコップをつかもうとするとき、本当に必要なのは「いまここにある映像」より「このあとコップがどう動くか」の予測だ。従来の映像AIは、すでに起こった動きを解析する「知覚」が中心だっ
読む →ローカル環境でAIを動作させるプラットフォーム「Ollama」の最新リリース候補版が公開された。今回の更新では、Moonshot AIの「Kimi-K2.6」やZhipu AIの「GLM-5.
読む →LangChainのエコシステムにおいて、検索特化型AI「Perplexity」との統合パッケージがバージョン1.3.1へと更新された。このアップデートの本質は、単なるバグ修正ではない。大規模
読む →2025年7月10日、AI推論エンジン「llama.cpp」の開発リポジトリにおいて、SWA(Sliding Window Attention)専用モデルの実行時に発生するクラッシュを修正する
読む →llama.cppの最新ビルドb9330で、NVIDIA Nemotron 3 Super 120Bモデルの推論速度が毎秒64.9トークンから103.22トークンへ約59%改善した。一見すると
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」の最新ビルド(b9411)において、中国DeepSeekの最新モデル「DeepSeek V3.2」への正式対応が追加された。今
読む →27日、ローカルLLM実行環境として開発が進むオープンソースプロジェクト「Ollama」のリポジトリにおいて、バージョン0.30.0のリリース候補版rc26が公開された。コミットログに記された
読む →大規模言語モデル(LLM)を開発・実験する現場で、学習途中の「状態」を保存し、後から正確に再現することは極めて重要だ。今回、ローカルAI推論エンジン「llama.cpp」のテストコードが刷新さ
読む →
AIの大規模言語モデル(LLM)開発において、学習を高速化する「最適化アルゴリズム」の選択肢が広がろうとしている。NVIDIAは2024年7月、同社の分散学習フレームワーク「Megatron」
読む →オープンソースのローカルLLM実行環境「Ollama」のWebユーザーインターフェース(Web UI)に、独自のCSS(カスケーディングスタイルシート)を差し込める機能が追加された。この変更に
読む →
NTTデータは6月12日、AI活用の社内事例を集めたウェブサイト「Explore all use cases」を公開した。事例数は200件を超え、金融、製造、公共などあらゆる業種を網羅する。同
読む →
宇宙空間でしか得られない極限環境データが、いま人工知能の信頼性を左右する計測標準の世界を揺るがしている。米国国立標準技術研究所は7種類の標準物質を国際宇宙ステーションへ送り込んだ。ハウスダスト
読む →画像や動画を生み出す生成AIの世界で、いま「操作環境」そのものを進化させる動きが注目されている。対話型ではなく、ノード(処理の部品)を自由につなぎ合わせて画像を生成する「ComfyUI」の最新
読む →
米国では現在、514,000件を超えるサイバーセキュリティ関連の求人が埋まらないままとなっている。国立標準技術研究所(NIST)の発表によると、この深刻な人材ギャップに対応するため、18の教育
読む →
米国国立標準技術研究所(NIST)が発表した新たな法医学向け標準物質は、複数人物の高品質DNAと劣化DNAを意図的に混合した初の認証標準物質である。犯罪捜査機関の分析精度を左右するこの供給は、
読む →米新興企業Anthropicは2025年5月、小規模企業向けの新サービス「Claude for Small Business」を発表した。月額40ドルで、大企業向けと同等の対話型AI機能をチー
読む →Intelの技術者Chun Tao氏が、ARMアーキテクチャにおける量子化モデルの推論高速化に向けた新たな実装を公開した。変更の対象は、llama.cppが提供するQ6_K量子化形式を用いた行
読む →大規模言語モデル(LLM)の推論・実行を支えるオープンソースの基盤ソフトウェアに、カナダCohere(コヒア)が開発する新たなモデルアーキテクチャ「cohere2-MoE」のサポートが追加され
読む →AIモデルの軽量化と多様な動作環境への適応が同時に進行している。オープンソースの小型言語モデル「TINY_AYA」に、Cohere社の「cohere2moe」と呼ばれる語彙拡張技術が統合された
読む →機械学習フレームワーク「llama.cpp」の開発リポジトリで、Appleシリコン搭載Macにおける内部処理の待機時間を500ミリ秒から5ミリ秒へと100分の1に短縮する変更がマージされた。こ
読む →Appleシリコンを搭載したMac上で、AIモデルの実行速度を左右する「BFloat16(BF16)」と呼ばれる計算形式への対応が、オープンソースの機械学習フレームワークにおいて一段と進んだ。
読む →
この記事を一言でいうと Google DeepMindが開発したオープンな軽量AIモデル「Gemma 4」が、Amazon Bedrock上で利用可能になった。画像とテキストの同時処理や組み込
読む →大規模言語モデル推論フレームワーク「llama.cpp」の開発チームは、ビルドb9193において、埋め込みベクトルの正規化フラグ(--embd-normalize)をサーバー実装全体に適用する
読む →AI推論エンジンの代表格であるllama.cppが、マルチトークン予測(MTP)のプロンプトデコード処理で発生していた不要なlogitsコピーを排除した。この変更はビルド番号b9200として公
読む →AI業界の推論基盤として急速に普及しているオープンソースプロジェクト「llama.cpp」が、ビルド番号b9204においてIBMの研究開発部門による新機能を統合した。今回マージされたプルリクエ
読む →コミットが映すエッジ推論の高速化競争 2025年に公開されたllama.cppビルドb9208には、SYCLバックエンド上で小さなfloat32行列積をoneMKLに委ね、oneDNNを迂回す
読む →2025年7月某日、llama.cppの新たなビルドb9213が公開された。一見すると定例アップデートに見えるこのリリースは、内部的な「pre-norm embedding mask flag
読む →今回のアップデートで注目すべきは、QualcommのAIエンジン「Hexagon」向けにMROPEとIMROPEという二つの位置符号化方式が実装された点である。これは単なる機能追加ではなく、エ
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新リリースb9255が公開された。今回の更新の中核は、QualcommのSnapdragonプラットフォームに搭載さ
読む →大規模言語モデル推論基盤のllama.cppがバージョンb9258を公開し、DeepSeek-OCRの画像処理を抜本的に改修した。Pillowとの完全互換を達成し、マルチモーダルモデルの文字認
読む →大規模言語モデル(LLM)を動かす軽量推論エンジン「llama.cpp」の最新ビルド(b9284)が公開された。今回の更新では、DNA配列を扱う特殊なトークナイザー「HybridDNA」におい
読む →AIモデルを個人のPCやスマートフォンで動かす「ローカル推論」の分野で、AMD製CPU(Ryzen/EPYCなどZenアーキテクチャ)向けの最適化が新たな段階に入った。オープンソースのAI推論
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の開発コミュニティが、最新ビルド「b9297」において、Alibaba(阿里巴巴)の次世代モデル「Qwen3.5」向けと
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」の最新ビルド(b9320)が公開されました。今回のリリースは見た目には地味なバグ修正が中心ですが、内容はエッジデバイスやオンプ
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」が、新たなビルド番号b9326のバイナリ配布を開始した。このリリースは特定の機能追加を大々的に謳うものではないが、定期的なビル
読む →大規模言語モデルを個人のパソコンやスマートフォンで動かすための基盤ソフトウェア「llama.cpp」に、新たなリリースb9352が登場した。一見すると内部の関数名修正という地味な変更だが、これ
読む →オープンソースの大規模言語モデル実行環境「llama.cpp」が、新たにMiniCPM5のトークナイザーに対応した。これにより、MiniCPM5モデルをllama.cpp上で正しく動作させられ
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」において、環境変数の命名規則を「LLAMA_ARG_」プレフィックスに統一する変更がマージされた。この変更は一見地味だが
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルド(b9380)で、内蔵Webサーバー機能「llama-server」にHTTP ETag(エンティティタグ)
読む →大規模言語モデル(LLM)の推論エンジン「llama.cpp」において、GoogleのGemma 4モデルが音声を処理する際の内部計算に修正が入った。RMS正規化と呼ばれる数値安定化処理の微小
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルドb9394で、マルチヘッド・キーバリュー(KV)キャッシュのデフォルト動作が変更された。具体的には、クエリヘ
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」が、ビルドb9395をリリースした。今回のアップデートはヘルプ出力の改善という一見地味な内容だが、リリース資産として提供
読む →ローカル環境で動作する大規模言語モデル(LLM)の実行基盤「llama.cpp」の最新ビルド(b9412)で、サーバー機能のタイムアウト設定が従来のデフォルト値から3600秒(1時間)へと大幅
読む →オープンソースのAI推論エンジン「llama.cpp」に、DeepSeek-OCR 2と呼ばれる新しい画像認識モデルへの対応が追加されました。これにより、利用者はスキャンした書類やスクリーンシ
読む →中国の独自CPUアーキテクチャ「LoongArch(龍芯アーキテクチャ)」向けに、大規模言語モデルの推論フレームワーク「llama.cpp」が新たな最適化対応を実施した。今回の更新では、Loo
読む →大規模言語モデルを手元のPCやスマートフォンで動かすためのC++製推論エンジン「llama.cpp」が、中国語に特化した埋め込みモデル「jina-embeddings-v2-base-zh」の
読む →オープンソースの大規模言語モデル(LLM)推論エンジン「llama.cpp」において、モデルの「量子化バージョン」と「ファイル種別」の内部管理を共通化する変更が加えられた。一見すると地味なコー
読む →
OpenAIは2026年4月22日、ChatGPT向けに「ワークスペース エージェント」を発表した。これはCodex技術を活用し、チーム単位で複雑なタスクや長時間のワークフローを処理できる共有
読む →
2026年4月、研究チームが電子商取引向け会話エージェントの強化学習環境「Ecom-RLVE」を発表した。大規模言語モデルは会話に優れるが、複雑なショッピングタスクの完了には課題が残る。この技
読む →
Hカンパニーは2026年3月17日、マルチモーダルコンピューター使用エージェント「Holotron-12B」を公開した。同モデルは、従来の静的画像処理ではなく、対話型環境での認識・決定・行動を
読む →
IBMは2026年4月29日、オープンソースの大規模言語モデル「Granite 4.1」の技術詳細を公開した。このモデルは、単なる計算資源の増強ではなく、トレーニングプロセス全体における厳格な
読む →
エヌビディア(NVIDIA)は2026年4月28日、ドキュメントや音声、映像などを統合的に処理する新モデル「NVIDIA Nemotron 3 Nano Omni」を発表した。同モデルはエンタ
読む →
画像生成の質的転換点 米OpenAIは2026年4月21日、次世代画像生成モデル「ChatGPT イメージ 2.0」を正式にリリースした。同社はこの新モデルにより、AIによる画像生成の新たな時
読む →
2026年5月5日、OpenAIの将来を巡るイーロン・マスク氏とサム・アルトマン氏の法廷闘争が激化している。マスク氏はOpenAIが非営利の使命を放棄し利益追求に転じたとして訴訟を起こし、アル
読む →
生成AIを業務で使う企業が増えるにつれ、裏側で動くクラウド基盤の安定稼働は経営課題に直結するようになった。Amazon Web Services(AWS)が公開した「Amazon Bedroc
読む →ローカル環境で大規模言語モデル(LLM)を動作させるプラットフォーム「Ollama」が、新たにKimi-K2.6、GLM-5.1、MiniMaxといった中国発のモデル群をサポートするリリース候
読む →マルチAIエージェントを扱うCrewAIの最新アップデートでは、複数のAIにまたがる作業手順を「フロー」として定義・実行する仕組みが大幅に強化された。これまでエンジニアがPythonコードで記
読む →
大規模言語モデル(LLM)の進化に伴い、その統合アプリケーションへの攻撃も高度化している。特に「プロンプトインジェクション」は、OWASPがLLMアプリケーションに対する最大の脅威として位置づ
読む →大規模言語モデル(LLM)を本番環境で動かすための推論エンジン「vLLM」が、新たなリリース候補版 v0.23.1rc0 を公開した。今回の更新はバグ修正とCI(継続的インテグレーション)パイ
読む →IBMが開発を主導するオープンな音声モデル「Granite Speech」の推論処理に、重要な修正が加わった。音声認識や音声合成といった処理の中核を担う推論エンジン「llama-graph」に
読む →オープンソースの大規模言語モデル(LLM)実行環境「llama.cpp」に、テキスト前処理の内部構造を刷新し、新たにアクセント記号を除去するオプション「strip_accents」を追加する変
読む →大規模言語モデル(LLM)を手元のマシンで動かすための代表的なC++実装「llama.cpp」に、投機的デコーディング(Speculative Decoding)の新手法「EAGLE3」が追加
読む →AI業界で広く使われる推論フレームワーク「llama.cpp」に、一見地味ながら大きな設計変更が加わった。ヘッダファイルの依存関係を整理し、不要なインクルードを削除するこの修正は、ビルド時間の
読む →大規模言語モデル(LLM)を手元のパソコンやスマートフォンで動かすための基盤ソフトウェア「llama.cpp」に、テキスト生成後の処理を外部から細かく制御できる仕組みが導入された。この変更はM
読む →大規模言語モデルを手元のパソコンやスマートフォンで動かすためのライブラリ「llama.cpp」に、内部のリソース管理を簡素化する変更が加えられた。複数に分散していたスロット(計算枠)の選定ロジ
読む →一部のレイヤーにだけ新型の高速化機構を載せるという設計思想が、モデルを動かすための読み込み処理と衝突し、起動できない問題が起きていた。今回の修正で、構造に合わせた柔軟な読み込みが可能になり、G
読む →大規模言語モデル(LLM)を動かすための軽量推論ライブラリ「llama.cpp」を構成する「ggml」ライブラリにおいて、将来のIBMプロセッサ「POWER11」への対応準備が進んでいる。現在
読む →AIモデルをスマートフォンやタブレットで動かす際、頭を悩ませるのがメモリの使い方と計算速度のバランスだ。今回、機械学習フレームワーク「llama.cpp」の開発リポジトリに投稿された一つの修正
読む →
AWSが生成AIの推論処理を詳細に可視化する新機能を実装した。モデルが本番環境でどのように振る舞い、どこで遅延やエラーが起きているのかをリアルタイムで追跡できる。これまでブラックボックス化しが
読む →オープンソースの大規模言語モデル推論エンジン「llama.cpp」が、macOSのApple Silicon(arm64)向けビルドにおいて、ArmのAI最適化ライブラリ「KleidiAI」を
読む →
2026年第1四半期、ChatGPTの利用者層で35歳以上の伸びが全年齢層で最も高く、男女比も均衡に向かい、生成AIが幅広い世代と性別へ浸透する転換点を迎えたことが関係者の分析で明らかになった
読む →
空行 米バークレー大学などの研究チームは、大規模言語モデル(LLM)に現実的で多様な「仮想人格」を付与する新手法「Anthology」を開発した。従来のLLMは、特定のバイアスや均質的な回答傾
読む →オープンソースの大規模言語モデル(LLM)推論フレームワーク「llama.cpp」において、DockerイメージのビルドプロセスにWebユーザーインターフェース(UI)が標準で組み込まれる変更
読む →オープンソースの大規模言語モデル(LLM)推論コミュニティで最も活発なプロジェクトの一つ「llama.cpp」が、新たなリリースでs390xアーキテクチャ向けDockerイメージへのWeb U
読む →
カリフォルニア大学バークレー校の人工知能研究センター(BAIR)は、大規模な学習済み世界モデルを用いた長期的な計画立案を可能にする新しい勾配ベースのプランナー「GRASP」を開発した。近年、大
読む →Googleが開発するオープンモデル「Gemma」シリーズの最新版において、特定の演算処理に関する脆弱性修正が行われた。この修正は、MacやiPhone、iPadといったApple製品上でAI
読む →オープンソースの機械学習ライブラリ「llama.cpp」を構成するggml-cpuにおいて、RISC-Vアーキテクチャ向けのベクトル量子化処理が512ビットや1024ビットといった、より長いベ
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルド構成において、CPUバックエンド無効時に「cvector-generator」と「export-lora」の
読む →大規模言語モデルを手元のパソコンやスマートフォンで動かすための軽量推論フレームワーク「llama.cpp」において、処理の無駄を省き、より高速な応答を実現するコード修正が行われた。この変更は、
読む →ウェブブラウザ上で動作するAIの推論速度が、新たな最適化技術によって大幅に向上する可能性が出てきた。LLM推論を支える低ビット量子化演算に対し、WebAssembly SIMD128命令を活用
読む →Googleが開発するAIモデル実行エンジンの最新コミット「b9518」から、オンデバイス推論の高速化技術「spec checkpoints」が一部プラットフォームで無効化された。サーバーサイ
読む →ソフトウェア開発では、プロジェクトの依存関係を正確に再現することが品質と効率を左右する。今回、あるローカル実行型AIプロジェクトにおいて、 node_modules フォルダより packag
読む →オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」において、内部変数名を明確化するコード修正がマージされた。この変更は表面的な機能追加ではないが、多数のOSやハードウェア
読む →生成AIのローカル実行を支える軽量推論エンジン「llama.cpp」に、ログ出力の書式指定子を修正する小規模な変更がマージされた。この変更自体は技術的には軽微だが、同時に表示された対応プラット
読む →生成AIの推論をローカル端末で動かすための軽量ライブラリ「llama.cpp」の最新ビルド設定で、Apple Silicon向けにArmのKleidiAIを有効化したビルドターゲットが新たに確
読む →対話型AIが、考えている途中で突然沈黙してしまう。そんなユーザー体験のストレスを減らす技術修正が、オープンソースの大規模言語モデル(LLM)推論エンジン「llama.cpp」に行われた。修正対
読む →オープンソースのAI推論エンジン「llama.cpp」において、マルチモーダルモデル(画像認識などが可能なAI)の利用時に、ユーザーが独自に用意した画像処理用モデル(mmproj)を優先し、不
読む →大規模言語モデル(LLM)を動かす際に使われる「KVキャッシュ」と呼ばれる仕組みに関する修正が、 llama.cpp の開発プロジェクトでマージされた。今回の変更は、モデルが文書生成をするとき
読む →AIをパソコンやスマートフォンで動かすとき、応答が遅くなる大きな原因のひとつが「記憶領域」の扱いだった。今回、軽量AI推論エンジン「llama.cpp」に、この記憶領域のコピー処理を削減する変
読む →大規模言語モデルの推論効率を高める「スライディングウィンドウ・アテンション(SWA)」を単独で使う設計が、ソフトウェア内部の想定外の空バッファを生み、ロード時に停止してしまう問題が修正された。
読む →AIモデルの開発・テストを支える継続的インテグレーション(CI)の現場で、ジョブの重複や不要なビルドを整理し、限られた計算資源を最適配分する動きが顕在化している。Apple、OpenVINO、
読む →Googleが公開する軽量AIモデル「Gemma」の最新バージョンに、テキスト生成の速度と効率を大幅に改善する技術が実装された。この変更は、モバイル端末やパソコン上で直接AIを動作させる「オン
読む →
2024年のノーベル化学賞は、AlphaFold2によるタンパク質構造予測の功績を称え、AIが生物学にもたらした革命的な影響を世界に示した。しかし、構造を「予測」する段階を超え、実際に新しいタ
読む →
ガバナンスを維持する分散処理の障壁 企業が大規模言語モデルを業務活用する際、最大の課題はデータの統制とセキュリティの両立である。Databricks の Unity Catalog で一元管理
読む →
米Googleは次世代AI機能群「Gemini Intelligence」を発表した。Android上で旅行の予約やウェブフォームへの自動入力、音声メモの文章化と推敲を単一のAIエージェントが
読む →
(注:文字数カウントで指定範囲に収めるため微調整しています) 米フロリダ州立大学(FSU)で発生した銃乱射事件を巡り、遺族がOpenAIを提訴した。訴状によると、犯人は実行前にChatGPTで
読む →
米アップルは、新機能「Apple Intelligence」の利用条件について顧客に誤解を与えたとする集団訴訟に対し、2億5000万ドル(約375億円)を支払うことで和解することを同意した。こ
読む →
航空宇宙業界の製造現場における文書管理の効率化が、生成AIのマルチモーダル技術で実証された。Amazon Nova Multimodal EmbeddingsとAmazon S3 Vector
読む →
Proユーザー限定でPlaid連携を導入、金融アドバイス機能の拡大か 米OpenAIは2026年、有料のChatGPT Proユーザー向けに銀行口座の取引データを分析する新機能の提供を開始した
読む →
米カリフォルニア大学バークレー校の研究チームが、人間の視点から見た映像と動作データを用いて未来の映像を予測する「PEVA」という新しい世界モデルを開発した。従来の技術は物理法則の理解や多段階の
読む →
Anthropicの最新AIモデル「Mythos」の登場が、世界の金融機関や政府機関に激震をもたらしている。しかし専門家らは、Mythosが生み出したのは新たな脅威ではなく、既に存在したサイバ
読む →
OpenAIは2026年5月、著名人の声を高精度に複製できるAI音声スタートアップWeights.ggを買収した。買収額は非公表だが、約6名のチーム全員がOpenAIに合流している。今回の動き
読む →
GoogleはAndroid向けAIアシスタント「Gemini」に大規模な機能拡張を実施した。新たに導入された「Gemini Intelligence」により、ユーザーの指示に対して端末が複数
読む →
生成AIはテキスト処理だけでなく、動画コンテンツの分析領域でも急速に進化している。ITmediaの姉妹サイトが実施した独自テストによると、GoogleのGemini、OpenAIのChatGP
読む →
Googleは最新のAndroidアップデートを通じて、自社の生成AI「Gemini」をスマートフォンやChromeブラウザ、ノートパソコン、さらには自動車に至るまで、あらゆるデバイスに横断的
読む →
【記事転載・引用防止用ダミー文】本記事は独自分析に基づく解説であり、元記事の全文翻訳ではない。 Microsoftは2026年5月、100体以上の特化型AIエージェントを相互競合させてソフトウ
読む →
Googleは2026年5月、AI検索に特化した最適化手法「GEO(Generative Engine Optimization)」や「AEO(Answer Engine Optimizati
読む →
米Googleは5月、AI検索に特化した新たなSEO手法として一部で提唱される「GEO(生成エンジン最適化)」や「AEO(回答エンジン最適化)」について、これらは単なる従来型SEOの言い換えに
読む →
OpenAIの研究者が発表した新たな事前学習手法「EMO」は、モデルが自律的に専門家構造を獲得する能力を示し、大規模言語モデルの設計論に一石を投じた。Mixture of Experts(Mo
読む →
サイバーセキュリティの未来は人工知能(AI)の「開放性」が握っている。ウイルス対策ソフトで知られる米ウイルス総研(VirusTotal)の幹部が、オープンソースのAIモデルこそが悪意ある攻撃か
読む →
情 OpenAIは、AIの普及が進む「インテリジェンス時代」に向けたサイバーセキュリティ強化策として、5つの柱からなる行動計画を発表した。AIを活用した防御技術の民主化と重要インフラ保護を軸に
読む →
2026年春時点で、主要な大規模言語モデル(LLM)の83%がHugging Face上で公開・共有されており、AI研究開発における同プラットフォームの一極集中が加速している。Hugging
読む →
ベルギーのウェアラブル耳栓メーカーLoop Earplugsは、主力製品のQuiet 2やギフトセットを含む全製品を対象とした40パーセント割引キャンペーンを開始した。騒音対策が睡眠の質や集中
読む →
センテンストランスフォーマー(Sentence Transformers)は、テキストと画像を統合的に処理できるマルチモーダル埋め込みモデルとリランカーモデルを相次いで公開した。これにより、異
読む →
OpenAIは4月10日、テキスト内の個人識別情報(PII)を高精度で検出し自動編集する「OpenAI Privacy Filter」を公開した。モデルの重みを完全公開するオープンウェイト方式
読む →
オープンソースのライブラリであるSentence Transformers(センテンス・トランスフォーマーズ)が、テキストと画像を同時に扱うマルチモーダル埋め込みモデルとリランカーモデルの学習
読む →
AI開発プラットフォームを運営するHugging Faceは、大規模言語モデルの学習後処理(ポストトレーニング)を担う中核ライブラリ「TRL(Transformer Reinforcement
読む →
在宅勤務の定着により、人間工学に基づくオフィス家具の需要が再燃している。米国のUplift Deskは春季セットアップセールを開始し、スタンディングデスクや人間工学チェアを含む主要製品を最大5
読む →
米国の格安通信事業者Visibleが2026年5月に提供するプロモーションコードの全容が明らかになった。新規契約者と長期利用者の双方を対象に、通信料金から合計400ドル超を削減できる仕組みであ
読む →