Foundation Models

基盤モデル

OpenAI、Anthropic、Google、Meta、xAIなどのモデル競争と技術潮流を整理します。

推論モデル

基盤モデルを理解するための重要テーマ。

マルチモーダル

基盤モデルを理解するための重要テーマ。

オープンモデル

基盤モデルを理解するための重要テーマ。

モデル価格

基盤モデルを理解するための重要テーマ。

Latest Articles

最新記事

金融決済の“行動パターン”をAIが学習する時代へ──NVIDIAが取引基盤モデルの構築手法を公開

金融決済の“行動パターン”をAIが学習する時代へ──NVIDIAが取引基盤モデルの構築手法を公開

クレジットカードの利用履歴や送金のたびに蓄積される取引データは、人の行動を映し出す鏡だ。しかし多くの金融機関では、不正検知や与信判断を人手で設計したルールや静的な特徴量に頼ってきた。NVIDI

読む →
医療AIの「聞き間違い」をどう防ぐか──合成音声で評価を高速化するNVIDIAの新手法

医療AIの「聞き間違い」をどう防ぐか──合成音声で評価を高速化するNVIDIAの新手法

病院や診療現場で使われる音声AIにとって、薬剤名や解剖学用語を正確に認識することは想像以上に難しい。「アセトアミノフェン」「アムロジピン」「セファゾリン」といった薬の名前は、日常会話にほとんど

読む →
ChatGPTの「健康相談」、無料ユーザーにも高度な判断力が届く構造に

ChatGPTの「健康相談」、無料ユーザーにも高度な判断力が届く構造に

OpenAIは2026年6月18日、無料版ChatGPTに提供されているGPT-5.5 Instantが、健康・ウェルネス領域で大幅な応答性能向上を達成したと発表した。医師が設計した評価基準に

読む →
GPT‑5.4が創薬化学の難反応を改善、自律型AI実験室が研究の「相棒」に

GPT‑5.4が創薬化学の難反応を改善、自律型AI実験室が研究の「相棒」に

製薬業界で長年使われてきた化学反応の収率を、AIが自律的に実験を繰り返して引き上げる成果が明らかになった。OpenAIとMolecule.oneの研究チームは、最新モデル「GPT‑5.4」と自

読む →
稀な遺伝病の診断にAI推論モデルが進展、未解決事例から18件の新たな診断を導く

稀な遺伝病の診断にAI推論モデルが進展、未解決事例から18件の新たな診断を導く

子どもの希少遺伝性疾患をめぐる診断プロセスが変わり始めている。専門医による長年の解析でも原因が特定できなかった症例に対し、AIの高度な推論能力を組み合わせることで、新たに18件の診断が確定した

読む →
ラック単位で推論コストが10分の1に──CoreWeaveがNVIDIA Vera Rubinで示すAIインフラの新水準

ラック単位で推論コストが10分の1に──CoreWeaveがNVIDIA Vera Rubinで示すAIインフラの新水準

大規模言語モデルが常時稼働し、自律的に推論・判断する「エージェントAI」への移行が本格化している。この変化の裏で、膨大な計算を支えるインフラの再設計が静かに進行中だ。クラウド事業者CoreWe

読む →
ChatGPTの「記憶」が脱メモ化、会話の全体像から文脈を自動構成する仕組みへ

ChatGPTの「記憶」が脱メモ化、会話の全体像から文脈を自動構成する仕組みへ

これまでChatGPTは、ユーザーが明示的に「覚えておいて」と指示した情報だけを断片的に保持していた。しかし今回の更新で、過去のすべての会話履歴を参照し、そこから最新かつ適切な文脈を自動的に合

読む →
CoreWeave、Moonshot AIの最新コーディングモデルで最速推論を達成 価格性能競争が新段階に

CoreWeave、Moonshot AIの最新コーディングモデルで最速推論を達成 価格性能競争が新段階に

AIモデルの性能を測る指標は、単なる「賢さ」から「コストあたりの処理速度」へと重心を移している。この変化を象徴する出来事として、AI推論サービスを提供するCoreWeaveが、Moonshot

読む →
住宅ローン申請の「見えない待ち時間」を削る──Rocket CloseがAWSで構築したAIエージェントの実力

住宅ローン申請の「見えない待ち時間」を削る──Rocket CloseがAWSで構築したAIエージェントの実力

この記事を一言でいうと 住宅ローンに必要な「権原調査」の業務を、AIエージェントが州法や郡ごとの細かいルールを横断検索しながら支援する仕組みが稼働し始めた。 なぜ話題なのか 米国で住宅ローンを

読む →
合成3D医療画像がもたらすラジオロジーAIの寡占化構造

合成3D医療画像がもたらすラジオロジーAIの寡占化構造

NVIDIAが2026年5月、大規模な合成3D医療画像生成の成果を公開した。量・質ともに実用的な合成CTやMRIを生成し、そのデータで事前学習させた医療AIモデルを業界に提供する計画である。背

読む →
OpenAIのGPT-5.5を含む最先端モデル、AWS上で一般提供開始 エンタープライズAI導入の「調達と運用」障壁が変わる

OpenAIのGPT-5.5を含む最先端モデル、AWS上で一般提供開始 エンタープライズAI導入の「調達と運用」障壁が変わる

OpenAIのフロンティアモデルと、ソフトウェア開発エージェント「Codex」が、Amazon Web Services(AWS)上で一般利用可能になった。これにより、既にAWSを業務基盤とし

読む →
AnthropicがOpus 4.8で狙う「長時間協働」、エージェント性能と速度の両立が示す競争軸の変化

AnthropicがOpus 4.8で狙う「長時間協働」、エージェント性能と速度の両立が示す競争軸の変化

Anthropicは2026年5月28日、最上位モデルの新バージョン「Claude Opus 4.8」を発表した。今回の更新で注目すべきは、単なる性能向上ではなく、人間とAIが長時間にわたって

読む →
クロード導入支援に「格付け」、Anthropicが企業向けパートナー制度を再編──案件実績で3段階の選別へ

クロード導入支援に「格付け」、Anthropicが企業向けパートナー制度を再編──案件実績で3段階の選別へ

企業がAIを業務に組み込む動きが加速するなか、クロード(Claude)を手がけるAnthropicが、導入支援を担うパートナー企業の実力を外から見えやすくする仕組みを導入した。パートナー企業を

読む →
NVIDIAの通信事業者向けAI工場で進むトークン課金型サービスの構造変革

NVIDIAの通信事業者向けAI工場で進むトークン課金型サービスの構造変革

通信事業者がNVIDIA Cloud Partnerのリファレンスアーキテクチャに基づくAI工場を建設し、そこからトークンベースの課金モデルでAIサービスを提供する動きが具体化している。インド

読む →
三菱UFJ銀行が全社AI基盤にOpenAI採用、約3万5000人に展開──金融の「AIネイティブ化」へ始動

三菱UFJ銀行が全社AI基盤にOpenAI採用、約3万5000人に展開──金融の「AIネイティブ化」へ始動

金融機関におけるAI活用が、業務効率化の道具から「組織とサービスの根幹を変える存在」へ移行し始めている。三菱UFJフィナンシャル・グループ(MUFG)が、OpenAIの「ChatGPT Ent

読む →
表データ専用AI「NEXUS」がAWSに登場、数カ月かかった予測が数日で完了する構造変化

表データ専用AI「NEXUS」がAWSに登場、数カ月かかった予測が数日で完了する構造変化

企業のERPやCRM、データベースに眠る膨大な表形式データ。その分析に3〜6カ月もの時間と専門チームを要していた現場へ、事前学習済みの専用基盤モデルがクラウド上で直接使えるようになった。Ama

読む →
BBVAが10万人の社員にChatGPT Enterpriseを展開、銀行業務をAIで再設計する「The Eight」構想の全容

BBVAが10万人の社員にChatGPT Enterpriseを展開、銀行業務をAIで再設計する「The Eight」構想の全容

銀行のサービスは、これまで「支店に行く」「アプリを開く」「電話をかける」といった能動的な行動から始まるのが当たり前だった。だが、スペイン発のグローバル金融機関BBVAがOpenAIと結んだ戦略

読む →
チャットボット以外でも成果を上げる直接選好最適化──OCR分野でテキスト崩壊率を6割削減

チャットボット以外でも成果を上げる直接選好最適化──OCR分野でテキスト崩壊率を6割削減

大規模言語モデルの調整手法として知られる「直接選好最適化(DPO)」が、チャットボットの対話品質向上以外の領域で明確な効果を示した。ブラジルポルトガル語のOCR(光学文字認識)タスクにおいて、

読む →
GPT‑Rosalindの新展開、創薬ワークフローを直接支援するAIへ─評価指標も独自設計

GPT‑Rosalindの新展開、創薬ワークフローを直接支援するAIへ─評価指標も独自設計

OpenAIがライフサイエンス専用モデル「GPT‑Rosalind」の機能拡張を発表した。従来の言語モデルが苦手としてきた創薬やゲノム解析の現場で、実用的な性能を示す評価基準を独自に整備し、研

読む →
大規模言語モデルの高速化競争、「待ち時間」を根こそぎ減らす並列推測技術がAWSから登場

大規模言語モデルの高速化競争、「待ち時間」を根こそぎ減らす並列推測技術がAWSから登場

この記事を一言でいうと AWSが、大規模言語モデル(LLM)の応答速度を飛躍的に高める新技術「P-EAGLE」の導入手順を公開した。従来の逐次処理のボトルネックを解消し、より深い「先読み」を一

読む →
AIラジオ局が暴く生成AIの自律運用リスク 人間の監視なしでは誤情報拡散

AIラジオ局が暴く生成AIの自律運用リスク 人間の監視なしでは誤情報拡散

米国の技術開発企業Andon Labsは、複数の生成AIモデルに人間の介入なしで事業運営を任せる実験を継続している。その最新プロジェクトとして、4つのAIモデルにそれぞれラジオ局を運営させた結

読む →
xAIが長期タスク向け新モデル「Composer 2.5」を提供開始、コーディングAIの競争軸が「速さ」から「複雑さへの対応力」へ

xAIが長期タスク向け新モデル「Composer 2.5」を提供開始、コーディングAIの競争軸が「速さ」から「複雑さへの対応力」へ

AIによるプログラミング支援の世界で、「長く複雑な作業をどれだけ正確にこなせるか」という新たな競争軸が鮮明になってきた。xAIは2026年6月1日、対話型AI「Grok Build」上で新モデ

読む →
OpenAIが生物学特化のAI「GPT‑Rosalind」を本格展開、ワクチン開発とバイオ防衛が次の競争軸に

OpenAIが生物学特化のAI「GPT‑Rosalind」を本格展開、ワクチン開発とバイオ防衛が次の競争軸に

生物学の研究や創薬に特化した対話型AI「GPT‑Rosalind」を、OpenAIが2026年4月に正式発表した。同モデルは基礎生物学からトランスレーショナル医療までを対象とし、5月にはバイオ

読む →
Ollamaが大規模言語モデル通信の安定性を改善、サーバー側無通信時の仕様変更に対応

Ollamaが大規模言語モデル通信の安定性を改善、サーバー側無通信時の仕様変更に対応

個人や企業の端末で動作するローカルAI実行環境「Ollama」が、大規模言語モデル(LLM)の推論サーバーとの通信において、無通信時に送信される特定の信号を正しく無視するように修正を加えた。こ

読む →
ChatGPT Enterpriseに「使った分を見える化」機能、大企業のAIコスト管理が新段階へ

ChatGPT Enterpriseに「使った分を見える化」機能、大企業のAIコスト管理が新段階へ

大企業がChatGPTを全社導入する際の最大の壁は「コストの不透明さ」だった。OpenAIは2026年6月18日、法人向けプラン「ChatGPT Enterprise」にクレジット使用量の分析

読む →
3B級の小型AIで動く「経済シミュレーション」が示した、大規模モデルだけでは見えない競争軸

3B級の小型AIで動く「経済シミュレーション」が示した、大規模モデルだけでは見えない競争軸

小型の言語モデルだけで複数のAIエージェントを動かし、物々交換から格差の広がりまでを自律的に発生させる実験が公開された。大規模モデルではコスト的に難しい「多数のAIが同時に考え続ける」仕組みを

読む →
Open WebUIがデスクトップ化と自動化で変える推論基盤レイヤー

Open WebUIがデスクトップ化と自動化で変える推論基盤レイヤー

Open WebUIのv0.9.0リリースは、大規模言語モデル(LLM)を利用するためのユーザーインターフェースが、ブラウザの枠を超えてOSネイティブの実行環境へと進化したことを示している。同

読む →
Open WebUI端末機能の大幅拡張が示すノーコードAI開発基盤の方向性

Open WebUI端末機能の大幅拡張が示すノーコードAI開発基盤の方向性

Open WebUIのバージョン0.8.9が公開され、内蔵ターミナル「Open Terminal」に7つの新機能が追加された。この更新の本質は、ブラウザ上で完結する統合開発環境の実現にある。J

読む →
不正競争の相手は人間ではなく機械になった。AIが見つける脆弱性と、AIが悪用する脆弱性のはざまで、企業の防御モデルは根本的な再設計を迫られている。

不正競争の相手は人間ではなく機械になった。AIが見つける脆弱性と、AIが悪用する脆弱性のはざまで、企業の防御モデルは根本的な再設計を迫られている。

この記事を一言でいうと セキュリティの前提が「日単位のパッチ適用」から「時間単位の自動修復」へ変わり、AIクラウドを選ぶ企業には新たな基準が求められている。 なぜ話題なのか OpenBSDとい

読む →
【AI経済新聞】

【AI経済新聞】

llama.cppの推論基盤がマルチトークン予測を整理、「動画・音声の同時処理」にらむ再設計の意味 対話型AIをパソコンやスマートフォンで動かすための軽量実行環境「llama.cpp」に、次世

読む →
グロックがクイックコマースにAIを直接組み込む、「買う前に届く」次世代ショッピング体験が始動

グロックがクイックコマースにAIを直接組み込む、「買う前に届く」次世代ショッピング体験が始動

デリバリーアプリを開く前に、自分が欲しい商品がすでにカートに入っている。GopuffとSpaceXAIが発表したAIショッピングアシスタント「Go」は、そんな先回り型の購買体験を現実のものにし

読む →
CrewAIの最新プレリリースが示す「マルチAIエージェント」開発基盤の地殻変動

CrewAIの最新プレリリースが示す「マルチAIエージェント」開発基盤の地殻変動

自律的に動く複数のAIをチームのように連携させるフレームワーク「CrewAI」が、新たなプレリリース版を公開した。今回の更新は大規模な機能追加というより、開発基盤の安定性を高める布石である。し

読む →
Grok 4.3がAWS Bedrockに登場、AIエージェントの「幻覚」競争に新基準

Grok 4.3がAWS Bedrockに登場、AIエージェントの「幻覚」競争に新基準

企業向けAIの現場で、最も厄介な問題の一つが「幻覚(ハルシネーション)」だ。AIが自信満々に誤情報を出力してしまうこの課題に対し、xAIの最新モデル「Grok 4.3」が具体的な数値で回答を突

読む →
Ollama v0.30.4、中国発・中東発LLMの統合加速——ローカル推論基盤で進むマルチモデル対応

Ollama v0.30.4、中国発・中東発LLMの統合加速——ローカル推論基盤で進むマルチモデル対応

ローカル環境で大規模言語モデル(LLM)を動かすOllamaに、最新バージョンv0.30.4がリリースされた。今回の更新で、中国のMoonshot AIが開発した「Kimi-K2.6」や、清華

読む →
画像ダウンロード遅延を解消、SageMaker AIのコンテナキャッシュが生成AI推論の「2倍高速スケーリング」を実現

画像ダウンロード遅延を解消、SageMaker AIのコンテナキャッシュが生成AI推論の「2倍高速スケーリング」を実現

AIモデルを本番環境で提供する際、アクセス集中に応じてサーバーを増強する「スケールアウト」の遅さは、ユーザー体験を損なう重大な課題だった。Amazon SageMaker AIが新たに導入した

読む →
vLLM、推論テストの「無応答」を自動検出し早期停止する仕組みを導入──大規模LLM運用の信頼性向上へ

vLLM、推論テストの「無応答」を自動検出し早期停止する仕組みを導入──大規模LLM運用の信頼性向上へ

大規模言語モデル(LLM)を高速に動かす推論エンジン「vLLM」の開発チームは、自動テスト中に処理が止まってしまう問題を自動的に検出し、原因を即座に特定できる仕組みを導入した。LLMを本番環境

読む →
LangChain 1.3.1が示す「マルチクラウドLLM」運用の地殻変動

LangChain 1.3.1が示す「マルチクラウドLLM」運用の地殻変動

生成AIを自社のシステムに組み込むための代表的なフレームワーク「LangChain」が、バージョン1.3.1へとマイナーアップデートされた。今回の更新で最も注目すべき点は、Amazon Bed

読む →
NISTの制御カタログ改訂がソフトウェア更新の供給網を変える理由

NISTの制御カタログ改訂がソフトウェア更新の供給網を変える理由

AIの信頼性を根幹で支えるソフトウェアサプライチェーンに、米国国立標準技術研究所(NIST)が大きな修正を加えた。Special Publication 800-53の第5版リビジョン5.1.

読む →
Microsoftのマルチエージェント基盤AutoGenが示すAI開発の分業化加速

Microsoftのマルチエージェント基盤AutoGenが示すAI開発の分業化加速

マイクロソフトのマルチエージェントフレームワーク「AutoGen」の最新バージョンv0.7.5が公開された。今回のアップデートは単なるバグ修正の集合に見えるが、実はAI開発におけるインフラ層・

読む →
100万トークンの壁を越えるGLM-5.2、長期タスクで「実用できるオープンソース」へ

100万トークンの壁を越えるGLM-5.2、長期タスクで「実用できるオープンソース」へ

生成AIがコードを数時間かけて書き続ける——そんな「長期タスク」が現実になろうとしている。中国Z.AIが発表した大規模言語モデル「GLM-5.2」は、100万トークンの文脈を安定的に扱いながら

読む →
xAIの動画生成が6秒をわずか25秒に——「製作現場」を狙う第2世代の本気

xAIの動画生成が6秒をわずか25秒に——「製作現場」を狙う第2世代の本気

短尺動画の制作スピードがほぼ2倍になり、映像・音声・物理演算が一度に生成されるようになった。クリエイティブの試作と実制作の境界が、またひとつ消えようとしている。 この記事を一言でいうと xAI

読む →
Carbon 3BのDNAトークナイザーがllama.cppを変える理由

Carbon 3BのDNAトークナイザーがllama.cppを変える理由

llama.cppの開発リポジトリに、炭素原子の並びではなくDNA塩基配列を直接処理できる新トークナイザーがマージされた。HuggingFaceBioが公開するCarbonシリーズの3Bモデル

読む →
Oracleのクラウド予算でOpenAIのAIを使える道、企業調達に「2社まとめ買い」の選択肢

Oracleのクラウド予算でOpenAIのAIを使える道、企業調達に「2社まとめ買い」の選択肢

企業がすでに抱えるクラウド契約の枠組みのなかで、OpenAIの先端モデルや開発支援サービス「Codex」を利用できるようにする取り組みが動き出す。OpenAIとOracleは、Oracle C

読む →
クアルコムHexagonチップで推論高速化が進む理由

クアルコムHexagonチップで推論高速化が進む理由

クアルコムのエンジニアが主導し、AI推論フレームワーク「llama.cpp」にHexagon DSP向けのPAD演算カーネルが追加された。この変更は、モバイルやエッジデバイス上の大規模言語モデ

読む →
AWSの推論ルーティングが変える欧州AI利用、「待たされない基盤モデル」が企業の新常識に

AWSの推論ルーティングが変える欧州AI利用、「待たされない基盤モデル」が企業の新常識に

生成AIをビジネスで使いたい企業にとって、いま大きな壁となっているのが「モデルにアクセスできない」「処理待ちが発生する」という現実だ。とりわけEU圏では、データ保護規則(GDPR)に対応しなが

読む →
HunyuanOCR統合が変える視覚推論 マルチモーダル分岐廃止の狙い

HunyuanOCR統合が変える視覚推論 マルチモーダル分岐廃止の狙い

llama.cppの最新ビルドb9263で、騰訊(テンセント)系のHunyuanVLとHunyuanOCRが単一パスに統合された。この変更は、視覚言語モデルにおける推論エンジン側の無駄な分岐を

読む →
LangChain OpenAI 1.2.2が示すLLM仲介層の自動修復機能と低レイヤー依存の現実

LangChain OpenAI 1.2.2が示すLLM仲介層の自動修復機能と低レイヤー依存の現実

LangChainのOpenAI統合パッケージがバージョン1.2.2へと更新された。このリリースは、一見すると定期的なパッチ適用に見えるが、その内実はLLMアプリケーションを支える「仲介層」の

読む →
Strandsが画像理解評価基盤を刷新する理由

Strandsが画像理解評価基盤を刷新する理由

視覚言語モデル評価に特化した新指標登場の背景 AIによる画像キャプション生成や表解析の需要は小売から金融まで急速に拡大している。しかし生成テキストが画像の事実に即しているかを判定する評価手法は

読む →
タイトル:AWS顧客の9割が選ぶ基盤モデル提供元に新展開

タイトル:AWS顧客の9割が選ぶ基盤モデル提供元に新展開

AI開発のインフラ選択において、最終的な意思決定権を持つのはクラウド上で動くアプリケーションの担い手である。Amazon Bedrockの顧客データから、エンタープライズ規模でのモデル採用構造

読む →
生成AIで稼ぐ金融の壁、PalantirとTWGが実装した1220億円受注にみるAI導入の構造転換

生成AIで稼ぐ金融の壁、PalantirとTWGが実装した1220億円受注にみるAI導入の構造転換

金融サービス分野で、人工知能の商用導入が現実の収益に結びつく局面に入った。2025年6月、データ分析企業パランティア・テクノロジーズと金融サービスグループのTWGは、AIプラットフォーム「AI

読む →
企業の手元データを動かさずAIを育てる「NVIDIA FLARE」が示す、次のAI開発インフラ競争

企業の手元データを動かさずAIを育てる「NVIDIA FLARE」が示す、次のAI開発インフラ競争

AIの精度を上げるには良質なデータが欠かせない。しかし医療画像、金融取引記録、工場の検査データなど、最も価値の高いデータほど「外に出せない」制約がある。このジレンマに対し、NVIDIAのオープ

読む →
vLLM 0.20.1が示す推論基盤の異変、DeepSeek V4最適化の理由

vLLM 0.20.1が示す推論基盤の異変、DeepSeek V4最適化の理由

vLLMプロジェクトは2025年5月、バージョン0.20.1を公開した。今回のリリースはDeepSeek V4シリーズの安定化と性能最適化に焦点を絞ったパッチであり、15件を超える修正が単一モ

読む →
LangChain 1.3.4が修正した「人間の判断を仰ぐ機能」の拒否応答、AIエージェント信頼性の基盤に進展

LangChain 1.3.4が修正した「人間の判断を仰ぐ機能」の拒否応答、AIエージェント信頼性の基盤に進展

AIアプリケーションを支える開発フレームワーク「LangChain」の最新バージョン1.3.4が公開された。今回の更新は大きな機能追加ではなく、AIエージェントが人間に判断を求める際の「拒否」

読む →
MicrosoftのAutoGenが示すマルチAIエージェント基盤の再構築 バージョン0.7.3分岐の真意

MicrosoftのAutoGenが示すマルチAIエージェント基盤の再構築 バージョン0.7.3分岐の真意

Microsoft傘下のAIエージェントフレームワーク「AutoGen」が、バージョン0.7.3をリリースした。今回のアップデートは単なるバグ修正ではない。OpenAIの最新モデル「GPT-5

読む →
金融機関が個別AIから「取引基盤モデル」へ収れんする理由——サイロ化を超える次の競争軸

金融機関が個別AIから「取引基盤モデル」へ収れんする理由——サイロ化を超える次の競争軸

金融機関は長年、不正検知、与信、レコメンド、リスク管理といった領域ごとに専用AIを構築してきた。この「タスク特化型モデル」の乱立は一定の成果を上げたが、いま制度疲労を起こしつつある。データもシ

読む →
イーロンマスクのxAIがSpaceXと提携する構造的理由

イーロンマスクのxAIがSpaceXと提携する構造的理由

Elon Muskが率いるAI企業xAIは、宇宙開発企業SpaceXと大規模な技術提携に入った。この動きの本質は、単なる同一経営者傘下の企業間連携ではない。AI開発における計算資源の垂直統合と

読む →
Google Beamが示す会議室ハードウェアと生成AIの融合点

Google Beamが示す会議室ハードウェアと生成AIの融合点

Googleが法人向け会議室デバイス「Google Beam」に新たな実験的機能を追加した。この実験では、会議室内の2名とオンライン参加者3名による小規模ミーティングを想定し、映像と音声の処理

読む →
Microsoftのpyautogen v0.10.0公開とマルチエージェント開発環境が整う理由

Microsoftのpyautogen v0.10.0公開とマルチエージェント開発環境が整う理由

AIエージェント開発の主要フレームワークであるpyautogenがバージョン0.10.0のパッケージ公開基盤を整備した。今回の変更はPyPIへの公式パブリッシング設定が本番適用された初回リリー

読む →
【記事タイトル】

【記事タイトル】

文書AIの“誤抽出”が数分で改善、Amazon Bedrockの新機能が示す、人の手を介さない業務自動化の次なる競争軸 この記事を一言でいうと Amazon Bedrock Data Auto

読む →
推論性能と実用性を両立、次世代AIエージェント開発の選択肢が拡大する

推論性能と実用性を両立、次世代AIエージェント開発の選択肢が拡大する

「最高性能」と銘打たれた新たな大規模言語モデルがクラウド上で稼働を始めた。AnthropicのClaude Opus 4.8がAmazon Bedrockで利用可能になったという発表は、一見す

読む →
生成AIフレームワーク「LangChain」1.3.10が示す、モデル多様化時代の地味だが決定的な布石

生成AIフレームワーク「LangChain」1.3.10が示す、モデル多様化時代の地味だが決定的な布石

LangChainの最新バージョン1.3.10が公開された。今回のリリースは、派手な新機能追加ではない。暗号ライブラリの更新や、OpenAIのGPT-5系モデルへの対応修正といった「縁の下の保

読む →
vLLMがDockerイメージの依存関係を整理、推論エンジンの安定性向上へ一手

vLLMがDockerイメージの依存関係を整理、推論エンジンの安定性向上へ一手

大規模言語モデル(LLM)の推論エンジンとして注目を集めるオープンソースプロジェクト「vLLM」が、バージョン0.22.1のリリース候補版を公開した。今回の更新では、Dockerイメージのビル

読む →
DeepSeek-V4の初期化を修正、vLLMが推論エンジンとして次世代モデル対応を加速

DeepSeek-V4の初期化を修正、vLLMが推論エンジンとして次世代モデル対応を加速

オープンソースの大規模言語モデル(LLM)推論エンジン「vLLM」が、次世代モデル「DeepSeek-V4」の初期化時に発生していたCUTLASSライブラリとの互換性問題を解決した。この修正は

読む →
Open WebUI 0.9.5が塞ぐ3つの攻撃経路とSSRF対策

Open WebUI 0.9.5が塞ぐ3つの攻撃経路とSSRF対策

AIを社内導入する企業が増えるなか、ローカル環境やプライベートクラウドで動作するLLMフロントエンドのセキュリティ設計が急速に重要性を増している。2025年7月に公開されたOpen WebUI

読む →
LLM軽量化の共通処理に集約の動き、Apple Siliconから国産CPUまで単一コードで対応へ

LLM軽量化の共通処理に集約の動き、Apple Siliconから国産CPUまで単一コードで対応へ

大規模言語モデル(LLM)を実用的な速度で動かすには、モデルの「軽量化」が欠かせない。この軽量化処理の中核を担う「imatrix(重要度行列)」の読み込みコードが重複している問題に対し、単一の

読む →
LangChain、バージョン追跡を自動化──エコシステムの「見えない依存関係」が透明になる瞬間

LangChain、バージョン追跡を自動化──エコシステムの「見えない依存関係」が透明になる瞬間

エージェント開発を支えるフレームワーク「LangChain」の中核ライブラリ「langchain-core」がバージョン1.4.6へと更新された。今回の変更は、一見すると小規模なリリースに見え

読む →
エッジAIで自律動作が加速、NVIDIA JetPack 7.2が示すメモリ効率と実世界エージェントの新段階

エッジAIで自律動作が加速、NVIDIA JetPack 7.2が示すメモリ効率と実世界エージェントの新段階

身体性を持つAIエージェントが、クラウドに依存せず現場で判断し動く時代が近づいている。NVIDIAが公開した最新の開発キットは、ロボットや自律機械の頭脳を小型デバイス上で効率的に動かすための基

読む →
MTP推論がllama.cppに統合、投機的デコーディングの無駄を削減

MTP推論がllama.cppに統合、投機的デコーディングの無駄を削減

ローカルLLM推論のデファクトスタンダードであるllama.cppに、マルチトークン予測を可能にするMTP(Multi-Token Prediction)サポートがマージされた。GitHubの

読む →
llama.cpp推論最適化がMTPと投機的復号を強化する理由

llama.cpp推論最適化がMTPと投機的復号を強化する理由

llama.cppプロジェクトのビルドb9235がリリースされた。今回の更新は、大規模言語モデルの推論速度を左右する投機的復号の仕組みを大幅に再編し、特にMTP(Multi-Token Pre

読む →
llama.cppのテストアーキテクチャ変更が示す推論基盤の品質戦略

llama.cppのテストアーキテクチャ変更が示す推論基盤の品質戦略

オープンソースの大規模言語モデル推論エンジン「llama.cpp」において、保存・読み込み機能がサンプルコードから正式なテスト体系へと移行された。これは単なるファイル配置の変更ではなく、推論エ

読む →
オープンソースLLM実行基盤「llama.cpp」のビルドb9441、MSVCコンパイラのETag処理バグを修正し配信安定性が向上

オープンソースLLM実行基盤「llama.cpp」のビルドb9441、MSVCコンパイラのETag処理バグを修正し配信安定性が向上

大規模言語モデル(LLM)を個人のパソコンやスマートフォンで動かすための代表的なオープンソース基盤「llama.cpp」の新たなビルド(b9441)が公開された。今回の更新では、Microso

読む →
LGのEXAONE 4.5がllama.cppに対応、マルチモーダル推論のローカル実行が現実的に

LGのEXAONE 4.5がllama.cppに対応、マルチモーダル推論のローカル実行が現実的に

韓国LGグループのAI研究組織が開発した大規模言語モデル「EXAONE 4.5」が、オープンソースの推論フレームワーク「llama.cpp」に正式対応した。画像とテキストを同時に扱うマルチモー

読む →
LangChainがコールバックのコンテンツブロック対応を強化、マルチモーダル開発の基盤に変化

LangChainがコールバックのコンテンツブロック対応を強化、マルチモーダル開発の基盤に変化

Python向け大規模言語モデル(LLM)アプリケーション開発フレームワーク「LangChain」の安定版パッケージであるlangchain-classicが、バージョン1.0.8へと更新され

読む →
自動運転AIの「走りながら学ぶ」時代へ、NVIDIAが閉ループ学習基盤を公開した意味

自動運転AIの「走りながら学ぶ」時代へ、NVIDIAが閉ループ学習基盤を公開した意味

自動運転の開発現場では、学習したモデルを実車に載せて走らせると、訓練時には見えなかった「ズレ」が次々と表面化する。この訓練と実環境のギャップをどう埋めるかが長年の課題だった。NVIDIAが公開

読む →
【AWSが自動運営AIの新設計図——「見張るAI」から「動くAI」へ、SRE業務の再定義が始まる】

【AWSが自動運営AIの新設計図——「見張るAI」から「動くAI」へ、SRE業務の再定義が始まる】

企業のITシステムが複雑化する中、障害を人が見張り続ける運用体制は限界に近づいている。AWSはこの課題に対し、Amazon Bedrock上で動作する自律型AI運用ソリューション「Amazon

読む →
2026年選挙でAI企業が守る7700万人の信頼と情報統制の分岐点

2026年選挙でAI企業が守る7700万人の信頼と情報統制の分岐点

2026年は世界人口の半数以上にあたる約40億人が投票権を持つ国に住む選挙イヤーである。この未曾有の民主主義集中年を前に、Googleは選挙関連の情報保護策とAI透明性強化に向けた複数施策の段

読む →
【AIが見た動画の“このあと”を言語で指示して当てさせる——3D動作予測の新モデルが変えるロボットと映像生成の設計図】

【AIが見た動画の“このあと”を言語で指示して当てさせる——3D動作予測の新モデルが変えるロボットと映像生成の設計図】

ロボットが目の前のコップをつかもうとするとき、本当に必要なのは「いまここにある映像」より「このあとコップがどう動くか」の予測だ。従来の映像AIは、すでに起こった動きを解析する「知覚」が中心だっ

読む →
Ollamaが推論エンジンをアップデート、中国発の新興大規模モデル「Kimi-K2.6」や「GLM-5.1」への対応を開始

Ollamaが推論エンジンをアップデート、中国発の新興大規模モデル「Kimi-K2.6」や「GLM-5.1」への対応を開始

ローカル環境でAIを動作させるプラットフォーム「Ollama」の最新リリース候補版が公開された。今回の更新では、Moonshot AIの「Kimi-K2.6」やZhipu AIの「GLM-5.

読む →
LangChainが検索特化モデル「Perplexity」連携を更新、精度向上がもたらす企業AI活用の地殻変動

LangChainが検索特化モデル「Perplexity」連携を更新、精度向上がもたらす企業AI活用の地殻変動

LangChainのエコシステムにおいて、検索特化型AI「Perplexity」との統合パッケージがバージョン1.3.1へと更新された。このアップデートの本質は、単なるバグ修正ではない。大規模

読む →
llama.cppのSWA専用モデル不具合が修正された理由

llama.cppのSWA専用モデル不具合が修正された理由

2025年7月10日、AI推論エンジン「llama.cpp」の開発リポジトリにおいて、SWA(Sliding Window Attention)専用モデルの実行時に発生するクラッシュを修正する

読む →
Nemotron推論速度が60%向上したバグ修正の理由

Nemotron推論速度が60%向上したバグ修正の理由

llama.cppの最新ビルドb9330で、NVIDIA Nemotron 3 Super 120Bモデルの推論速度が毎秒64.9トークンから103.22トークンへ約59%改善した。一見すると

読む →
llama.cppがDeepSeek V3.2対応を追加、推論速度とメモリ効率が大幅改善へ

llama.cppがDeepSeek V3.2対応を追加、推論速度とメモリ効率が大幅改善へ

オープンソースの大規模言語モデル推論エンジン「llama.cpp」の最新ビルド(b9411)において、中国DeepSeekの最新モデル「DeepSeek V3.2」への正式対応が追加された。今

読む →
Ollama最新ビルドが示す推論エンジン内製化の決定的分岐点

Ollama最新ビルドが示す推論エンジン内製化の決定的分岐点

27日、ローカルLLM実行環境として開発が進むオープンソースプロジェクト「Ollama」のリポジトリにおいて、バージョン0.30.0のリリース候補版rc26が公開された。コミットログに記された

読む →
AIモデルを「途中で保存・再開」するテストが、より柔軟に。llama.cppの設計変更が示す、ローカルAI開発の新たな基準点

AIモデルを「途中で保存・再開」するテストが、より柔軟に。llama.cppの設計変更が示す、ローカルAI開発の新たな基準点

大規模言語モデル(LLM)を開発・実験する現場で、学習途中の「状態」を保存し、後から正確に再現することは極めて重要だ。今回、ローカルAI推論エンジン「llama.cpp」のテストコードが刷新さ

読む →
大規模言語モデルの学習を2割加速、NVIDIAが「Shampoo」系最適化手法の実用化に本格着手

大規模言語モデルの学習を2割加速、NVIDIAが「Shampoo」系最適化手法の実用化に本格着手

AIの大規模言語モデル(LLM)開発において、学習を高速化する「最適化アルゴリズム」の選択肢が広がろうとしている。NVIDIAは2024年7月、同社の分散学習フレームワーク「Megatron」

読む →
OllamaがWeb UIのCSSカスタム設定を追加、バイナリ配布のまま企業ブランド適用が可能に

OllamaがWeb UIのCSSカスタム設定を追加、バイナリ配布のまま企業ブランド適用が可能に

オープンソースのローカルLLM実行環境「Ollama」のWebユーザーインターフェース(Web UI)に、独自のCSS(カスケーディングスタイルシート)を差し込める機能が追加された。この変更に

読む →
NTTデータが200種超のAI活用事例を公開 提案プロセス短縮の理由

NTTデータが200種超のAI活用事例を公開 提案プロセス短縮の理由

NTTデータは6月12日、AI活用の社内事例を集めたウェブサイト「Explore all use cases」を公開した。事例数は200件を超え、金融、製造、公共などあらゆる業種を網羅する。同

読む →
国際宇宙基地が示す計測標準の価値とAI品質保証の未来像

国際宇宙基地が示す計測標準の価値とAI品質保証の未来像

宇宙空間でしか得られない極限環境データが、いま人工知能の信頼性を左右する計測標準の世界を揺るがしている。米国国立標準技術研究所は7種類の標準物質を国際宇宙ステーションへ送り込んだ。ハウスダスト

読む →
ComfyUI最新版で加速する「ノード型画像生成」、クリエイター以外に広がる導入の波

ComfyUI最新版で加速する「ノード型画像生成」、クリエイター以外に広がる導入の波

画像や動画を生み出す生成AIの世界で、いま「操作環境」そのものを進化させる動きが注目されている。対話型ではなく、ノード(処理の部品)を自由につなぎ合わせて画像を生成する「ComfyUI」の最新

読む →
514,000件のサイバーセキュリティ人材不足にNISTが3百万ドル超を投入する構造

514,000件のサイバーセキュリティ人材不足にNISTが3百万ドル超を投入する構造

米国では現在、514,000件を超えるサイバーセキュリティ関連の求人が埋まらないままとなっている。国立標準技術研究所(NIST)の発表によると、この深刻な人材ギャップに対応するため、18の教育

読む →
NIST標準物質が変える法医学AIの精度要件と学習基盤

NIST標準物質が変える法医学AIの精度要件と学習基盤

米国国立標準技術研究所(NIST)が発表した新たな法医学向け標準物質は、複数人物の高品質DNAと劣化DNAを意図的に混合した初の認証標準物質である。犯罪捜査機関の分析精度を左右するこの供給は、

読む →
Anthropicが小規模企業向け生成AIサービスを発表、月額40ドルで大企業並みのAI活用を実現

Anthropicが小規模企業向け生成AIサービスを発表、月額40ドルで大企業並みのAI活用を実現

米新興企業Anthropicは2025年5月、小規模企業向けの新サービス「Claude for Small Business」を発表した。月額40ドルで、大企業向けと同等の対話型AI機能をチー

読む →
IntelがARM向け推論高速化へ syclでスカラーSWARバイト減算を実装

IntelがARM向け推論高速化へ syclでスカラーSWARバイト減算を実装

Intelの技術者Chun Tao氏が、ARMアーキテクチャにおける量子化モデルの推論高速化に向けた新たな実装を公開した。変更の対象は、llama.cppが提供するQ6_K量子化形式を用いた行

読む →
Cohere系AIモデル「Command」に新アーキテクチャ「cohere2-MoE」が統合、推論基盤の多様化が加速

Cohere系AIモデル「Command」に新アーキテクチャ「cohere2-MoE」が統合、推論基盤の多様化が加速

大規模言語モデル(LLM)の推論・実行を支えるオープンソースの基盤ソフトウェアに、カナダCohere(コヒア)が開発する新たなモデルアーキテクチャ「cohere2-MoE」のサポートが追加され

読む →
小型AIモデル「TINY_AYA」、Cohere系語彙技術の統合でマルチプラットフォーム対応が加速

小型AIモデル「TINY_AYA」、Cohere系語彙技術の統合でマルチプラットフォーム対応が加速

AIモデルの軽量化と多様な動作環境への適応が同時に進行している。オープンソースの小型言語モデル「TINY_AYA」に、Cohere社の「cohere2moe」と呼ばれる語彙拡張技術が統合された

読む →
Appleシリコン搭載MacのローカルAI処理を支える技術が、ソフトウェア更新で大幅に応答速度を改善

Appleシリコン搭載MacのローカルAI処理を支える技術が、ソフトウェア更新で大幅に応答速度を改善

機械学習フレームワーク「llama.cpp」の開発リポジトリで、Appleシリコン搭載Macにおける内部処理の待機時間を500ミリ秒から5ミリ秒へと100分の1に短縮する変更がマージされた。こ

読む →
Appleシリコン搭載MacでAI推論速度がさらに向上する布石、BFloat16対応が進む

Appleシリコン搭載MacでAI推論速度がさらに向上する布石、BFloat16対応が進む

Appleシリコンを搭載したMac上で、AIモデルの実行速度を左右する「BFloat16(BF16)」と呼ばれる計算形式への対応が、オープンソースの機械学習フレームワークにおいて一段と進んだ。

読む →
Google、AWS上で軽量AI「Gemma 4」提供開始。推論特化・画像対応で企業導入の間口が変わる

Google、AWS上で軽量AI「Gemma 4」提供開始。推論特化・画像対応で企業導入の間口が変わる

この記事を一言でいうと Google DeepMindが開発したオープンな軽量AIモデル「Gemma 4」が、Amazon Bedrock上で利用可能になった。画像とテキストの同時処理や組み込

読む →
llama.cppの埋め込み正規化機能がサーバー実装へ統合完了

llama.cppの埋め込み正規化機能がサーバー実装へ統合完了

大規模言語モデル推論フレームワーク「llama.cpp」の開発チームは、ビルドb9193において、埋め込みベクトルの正規化フラグ(--embd-normalize)をサーバー実装全体に適用する

読む →
llama.cppのMTP推論で不要コピー排除 巨大言語モデルの推論速度が変わる軽量化

llama.cppのMTP推論で不要コピー排除 巨大言語モデルの推論速度が変わる軽量化

AI推論エンジンの代表格であるllama.cppが、マルチトークン予測(MTP)のプロンプトデコード処理で発生していた不要なlogitsコピーを排除した。この変更はビルド番号b9200として公

読む →
llama.cppがIBM発のSSM拡張をマージし大規模言語モデル推論の多様性が加速する

llama.cppがIBM発のSSM拡張をマージし大規模言語モデル推論の多様性が加速する

AI業界の推論基盤として急速に普及しているオープンソースプロジェクト「llama.cpp」が、ビルド番号b9204においてIBMの研究開発部門による新機能を統合した。今回マージされたプルリクエ

読む →
llama.cppの一見地味な修正が示す推論最適化の潮流

llama.cppの一見地味な修正が示す推論最適化の潮流

コミットが映すエッジ推論の高速化競争 2025年に公開されたllama.cppビルドb9208には、SYCLバックエンド上で小さなfloat32行列積をoneMKLに委ね、oneDNNを迂回す

読む →
llama.cppのビルドb9213が示す推論基盤の多層化と端末AIの主戦場

llama.cppのビルドb9213が示す推論基盤の多層化と端末AIの主戦場

2025年7月某日、llama.cppの新たなビルドb9213が公開された。一見すると定例アップデートに見えるこのリリースは、内部的な「pre-norm embedding mask flag

読む →
llama.cppがHexagonプロセッサの長文理解性能を底上げする理由

llama.cppがHexagonプロセッサの長文理解性能を底上げする理由

今回のアップデートで注目すべきは、QualcommのAIエンジン「Hexagon」向けにMROPEとIMROPEという二つの位置符号化方式が実装された点である。これは単なる機能追加ではなく、エ

読む →
Snapdragon向けAI推論ライブラリが6600万ダウンロード突破の理由

Snapdragon向けAI推論ライブラリが6600万ダウンロード突破の理由

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新リリースb9255が公開された。今回の更新の中核は、QualcommのSnapdragonプラットフォームに搭載さ

読む →
オープンソースOCR実装がDeepSeekモデル精度を向上させる理由

オープンソースOCR実装がDeepSeekモデル精度を向上させる理由

大規模言語モデル推論基盤のllama.cppがバージョンb9258を公開し、DeepSeek-OCRの画像処理を抜本的に改修した。Pillowとの完全互換を達成し、マルチモーダルモデルの文字認

読む →
llama.cppが「HybridDNA」トークナイザーの衝突を修正、生命科学×LLMの基盤が強化

llama.cppが「HybridDNA」トークナイザーの衝突を修正、生命科学×LLMの基盤が強化

大規模言語モデル(LLM)を動かす軽量推論エンジン「llama.cpp」の最新ビルド(b9284)が公開された。今回の更新では、DNA配列を扱う特殊なトークナイザー「HybridDNA」におい

読む →
AMD Zen系CPU向けのAI推論、8ビット量子化で高速化と省メモリを両立 エッジデバイスでのLLM活用がさらに現実的に

AMD Zen系CPU向けのAI推論、8ビット量子化で高速化と省メモリを両立 エッジデバイスでのLLM活用がさらに現実的に

AIモデルを個人のPCやスマートフォンで動かす「ローカル推論」の分野で、AMD製CPU(Ryzen/EPYCなどZenアーキテクチャ)向けの最適化が新たな段階に入った。オープンソースのAI推論

読む →
llama.cppが次世代AIモデル「Qwen3.5」の推論効率を高める新技術を実装、ローカルAIの性能競争が新局面へ

llama.cppが次世代AIモデル「Qwen3.5」の推論効率を高める新技術を実装、ローカルAIの性能競争が新局面へ

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の開発コミュニティが、最新ビルド「b9297」において、Alibaba(阿里巴巴)の次世代モデル「Qwen3.5」向けと

読む →
llama.cppの最新ビルド、メモリ管理のバグ修正で推論安定性が向上—エッジAI導入の足かせが一つ解消

llama.cppの最新ビルド、メモリ管理のバグ修正で推論安定性が向上—エッジAI導入の足かせが一つ解消

オープンソースの大規模言語モデル推論エンジン「llama.cpp」の最新ビルド(b9320)が公開されました。今回のリリースは見た目には地味なバグ修正が中心ですが、内容はエッジデバイスやオンプ

読む →
llama.cppがビルドb9326を公開、Apple SiliconからROCm、SYCLまでマルチプラットフォーム対応が定常化

llama.cppがビルドb9326を公開、Apple SiliconからROCm、SYCLまでマルチプラットフォーム対応が定常化

オープンソースの大規模言語モデル推論エンジン「llama.cpp」が、新たなビルド番号b9326のバイナリ配布を開始した。このリリースは特定の機能追加を大々的に謳うものではないが、定期的なビル

読む →
「llama.cpp」リリースb9352、AI推論エンジンの内部構造が整理される局面へ

「llama.cpp」リリースb9352、AI推論エンジンの内部構造が整理される局面へ

大規模言語モデルを個人のパソコンやスマートフォンで動かすための基盤ソフトウェア「llama.cpp」に、新たなリリースb9352が登場した。一見すると内部の関数名修正という地味な変更だが、これ

読む →
llama.cppがMiniCPM5に対応、軽量AIモデルの実用性が一段階上がる

llama.cppがMiniCPM5に対応、軽量AIモデルの実用性が一段階上がる

オープンソースの大規模言語モデル実行環境「llama.cpp」が、新たにMiniCPM5のトークナイザーに対応した。これにより、MiniCPM5モデルをllama.cpp上で正しく動作させられ

読む →
llama.cppの環境変数命名が「LLAMA_ARG_」に統一、マルチプラットフォーム開発の基盤強化へ

llama.cppの環境変数命名が「LLAMA_ARG_」に統一、マルチプラットフォーム開発の基盤強化へ

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」において、環境変数の命名規則を「LLAMA_ARG_」プレフィックスに統一する変更がマージされた。この変更は一見地味だが

読む →
llama.cpp、HTTP ETag対応でUI配信を効率化──ローカルAIサーバーの応答性が向上へ

llama.cpp、HTTP ETag対応でUI配信を効率化──ローカルAIサーバーの応答性が向上へ

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルド(b9380)で、内蔵Webサーバー機能「llama-server」にHTTP ETag(エンティティタグ)

読む →
Gemma 4の音声処理精度を左右する「正規化」の数値修正、オープンソースLLM推論の基盤で何が起きたのか

Gemma 4の音声処理精度を左右する「正規化」の数値修正、オープンソースLLM推論の基盤で何が起きたのか

大規模言語モデル(LLM)の推論エンジン「llama.cpp」において、GoogleのGemma 4モデルが音声を処理する際の内部計算に修正が入った。RMS正規化と呼ばれる数値安定化処理の微小

読む →
llama.cppがマルチヘッドKV対応を強化、推論の柔軟性が一段階進化

llama.cppがマルチヘッドKV対応を強化、推論の柔軟性が一段階進化

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルドb9394で、マルチヘッド・キーバリュー(KV)キャッシュのデフォルト動作が変更された。具体的には、クエリヘ

読む →
llama.cppのビルドb9395が示す、推論エンジン多様化の静かな進化

llama.cppのビルドb9395が示す、推論エンジン多様化の静かな進化

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」が、ビルドb9395をリリースした。今回のアップデートはヘルプ出力の改善という一見地味な内容だが、リリース資産として提供

読む →
llama.cppのサーバー機能、処理タイムアウトを1時間に延長——大規模モデルの推論安定化へ

llama.cppのサーバー機能、処理タイムアウトを1時間に延長——大規模モデルの推論安定化へ

ローカル環境で動作する大規模言語モデル(LLM)の実行基盤「llama.cpp」の最新ビルド(b9412)で、サーバー機能のタイムアウト設定が従来のデフォルト値から3600秒(1時間)へと大幅

読む →
llama.cppに画像認識の新機能、文書読み取り精度がさらに向上へ

llama.cppに画像認識の新機能、文書読み取り精度がさらに向上へ

オープンソースのAI推論エンジン「llama.cpp」に、DeepSeek-OCR 2と呼ばれる新しい画像認識モデルへの対応が追加されました。これにより、利用者はスキャンした書類やスクリーンシ

読む →
中国発LoongArchプロセッサ向けにAI推論最適化が加速、llama.cppが新命令セット対応でエッジAIの選択肢拡大へ

中国発LoongArchプロセッサ向けにAI推論最適化が加速、llama.cppが新命令セット対応でエッジAIの選択肢拡大へ

中国の独自CPUアーキテクチャ「LoongArch(龍芯アーキテクチャ)」向けに、大規模言語モデルの推論フレームワーク「llama.cpp」が新たな最適化対応を実施した。今回の更新では、Loo

読む →
llama.cppが中国語向け埋め込みモデル「jina-embeddings-v2-base-zh」に対応、多言語検索・RAG活用の間口が広がる

llama.cppが中国語向け埋め込みモデル「jina-embeddings-v2-base-zh」に対応、多言語検索・RAG活用の間口が広がる

大規模言語モデルを手元のPCやスマートフォンで動かすためのC++製推論エンジン「llama.cpp」が、中国語に特化した埋め込みモデル「jina-embeddings-v2-base-zh」の

読む →
llama.cpp、量子化バージョンとファイル種別の管理方式を整理—マルチプラットフォーム対応がさらに細分化

llama.cpp、量子化バージョンとファイル種別の管理方式を整理—マルチプラットフォーム対応がさらに細分化

オープンソースの大規模言語モデル(LLM)推論エンジン「llama.cpp」において、モデルの「量子化バージョン」と「ファイル種別」の内部管理を共通化する変更が加えられた。一見すると地味なコー

読む →
ChatGPT、Codex搭載のチーム用AIエージェント発表

ChatGPT、Codex搭載のチーム用AIエージェント発表

OpenAIは2026年4月22日、ChatGPT向けに「ワークスペース エージェント」を発表した。これはCodex技術を活用し、チーム単位で複雑なタスクや長時間のワークフローを処理できる共有

読む →
Ecom-RLVE、EC会話AIに強化学習適用

Ecom-RLVE、EC会話AIに強化学習適用

2026年4月、研究チームが電子商取引向け会話エージェントの強化学習環境「Ecom-RLVE」を発表した。大規模言語モデルは会話に優れるが、複雑なショッピングタスクの完了には課題が残る。この技

読む →
Hカンパニー、高スループットAI「Holotron-12B」発表

Hカンパニー、高スループットAI「Holotron-12B」発表

Hカンパニーは2026年3月17日、マルチモーダルコンピューター使用エージェント「Holotron-12B」を公開した。同モデルは、従来の静的画像処理ではなく、対話型環境での認識・決定・行動を

読む →
IBM Granite 4.1 LLM、高品質データで高性能化

IBM Granite 4.1 LLM、高品質データで高性能化

IBMは2026年4月29日、オープンソースの大規模言語モデル「Granite 4.1」の技術詳細を公開した。このモデルは、単なる計算資源の増強ではなく、トレーニングプロセス全体における厳格な

読む →
NVIDIA、Nemotron 3 Nano OmniでマルチモーダルAIの性能刷新

NVIDIA、Nemotron 3 Nano OmniでマルチモーダルAIの性能刷新

エヌビディア(NVIDIA)は2026年4月28日、ドキュメントや音声、映像などを統合的に処理する新モデル「NVIDIA Nemotron 3 Nano Omni」を発表した。同モデルはエンタ

読む →
OpenAI、ChatGPTイメージ2.0公開

OpenAI、ChatGPTイメージ2.0公開

画像生成の質的転換点 米OpenAIは2026年4月21日、次世代画像生成モデル「ChatGPT イメージ 2.0」を正式にリリースした。同社はこの新モデルにより、AIによる画像生成の新たな時

読む →
OpenAI訴訟 マスク対アルトマン 法廷闘争激化

OpenAI訴訟 マスク対アルトマン 法廷闘争激化

2026年5月5日、OpenAIの将来を巡るイーロン・マスク氏とサム・アルトマン氏の法廷闘争が激化している。マスク氏はOpenAIが非営利の使命を放棄し利益追求に転じたとして訴訟を起こし、アル

読む →
Amazon Bedrockの運用が“自動化レイヤー”へ移行、生成AI基盤の信頼性競争が始まる

Amazon Bedrockの運用が“自動化レイヤー”へ移行、生成AI基盤の信頼性競争が始まる

生成AIを業務で使う企業が増えるにつれ、裏側で動くクラウド基盤の安定稼働は経営課題に直結するようになった。Amazon Web Services(AWS)が公開した「Amazon Bedroc

読む →
Ollamaがマルチモデル対応を拡大、中国発LLM含むv0.30.9-rc0が示す「個人AI基盤」の加速

Ollamaがマルチモデル対応を拡大、中国発LLM含むv0.30.9-rc0が示す「個人AI基盤」の加速

ローカル環境で大規模言語モデル(LLM)を動作させるプラットフォーム「Ollama」が、新たにKimi-K2.6、GLM-5.1、MiniMaxといった中国発のモデル群をサポートするリリース候

読む →
AIマルチエージェントの「フロー定義」が本格化、CrewAIがJSON駆動とDMN対応で企業導入を加速

AIマルチエージェントの「フロー定義」が本格化、CrewAIがJSON駆動とDMN対応で企業導入を加速

マルチAIエージェントを扱うCrewAIの最新アップデートでは、複数のAIにまたがる作業手順を「フロー」として定義・実行する仕組みが大幅に強化された。これまでエンジニアがPythonコードで記

読む →
大規模言語モデルの致命的な脆弱性

大規模言語モデルの致命的な脆弱性

大規模言語モデル(LLM)の進化に伴い、その統合アプリケーションへの攻撃も高度化している。特に「プロンプトインジェクション」は、OWASPがLLMアプリケーションに対する最大の脅威として位置づ

読む →
vLLMがリリース候補版を公開、大規模言語モデル推論基盤のCIパイプライン改善が示す競争軸

vLLMがリリース候補版を公開、大規模言語モデル推論基盤のCIパイプライン改善が示す競争軸

大規模言語モデル(LLM)を本番環境で動かすための推論エンジン「vLLM」が、新たなリリース候補版 v0.23.1rc0 を公開した。今回の更新はバグ修正とCI(継続的インテグレーション)パイ

読む →
音声AIモデル「Granite」の推論精度を底上げする修正——llama-graphが示すマルチモーダル時代の基盤改善

音声AIモデル「Granite」の推論精度を底上げする修正——llama-graphが示すマルチモーダル時代の基盤改善

IBMが開発を主導するオープンな音声モデル「Granite Speech」の推論処理に、重要な修正が加わった。音声認識や音声合成といった処理の中核を担う推論エンジン「llama-graph」に

読む →
llama.cppの新正規化オプション「strip_accents」が示す、ローカルLLMの多言語対応最前線

llama.cppの新正規化オプション「strip_accents」が示す、ローカルLLMの多言語対応最前線

オープンソースの大規模言語モデル(LLM)実行環境「llama.cpp」に、テキスト前処理の内部構造を刷新し、新たにアクセント記号を除去するオプション「strip_accents」を追加する変

読む →
llama.cppに「EAGLE3」推論高速化手法が統合、推論時の待ち時間短縮へ現実的な一歩

llama.cppに「EAGLE3」推論高速化手法が統合、推論時の待ち時間短縮へ現実的な一歩

大規模言語モデル(LLM)を手元のマシンで動かすための代表的なC++実装「llama.cpp」に、投機的デコーディング(Speculative Decoding)の新手法「EAGLE3」が追加

読む →
ビルド高速化の裏で進む「AIフレームワーク再編」、llama.cppがヘッダ分割で示した次世代設計

ビルド高速化の裏で進む「AIフレームワーク再編」、llama.cppがヘッダ分割で示した次世代設計

AI業界で広く使われる推論フレームワーク「llama.cpp」に、一見地味ながら大きな設計変更が加わった。ヘッダファイルの依存関係を整理し、不要なインクルードを削除するこの修正は、ビルド時間の

読む →
llama.cppにモデル制御の新基盤、Macから全OSに広がる「ポストデコード」実装

llama.cppにモデル制御の新基盤、Macから全OSに広がる「ポストデコード」実装

大規模言語モデル(LLM)を手元のパソコンやスマートフォンで動かすための基盤ソフトウェア「llama.cpp」に、テキスト生成後の処理を外部から細かく制御できる仕組みが導入された。この変更はM

読む →
llama.cppがスロット管理を一本化、AI推論エンジンの効率が変わる

llama.cppがスロット管理を一本化、AI推論エンジンの効率が変わる

大規模言語モデルを手元のパソコンやスマートフォンで動かすためのライブラリ「llama.cpp」に、内部のリソース管理を簡素化する変更が加えられた。複数に分散していたスロット(計算枠)の選定ロジ

読む →
大規模言語モデル「GLM-5.2」の読み込み失敗を修正、軽量アーキテクチャ「DSA」の選択的適用が動作へ

大規模言語モデル「GLM-5.2」の読み込み失敗を修正、軽量アーキテクチャ「DSA」の選択的適用が動作へ

一部のレイヤーにだけ新型の高速化機構を載せるという設計思想が、モデルを動かすための読み込み処理と衝突し、起動できない問題が起きていた。今回の修正で、構造に合わせた柔軟な読み込みが可能になり、G

読む →
IBM POWER11時代を見据えたオープンソースAI基盤、コンパイラ対応で前倒し整備へ

IBM POWER11時代を見据えたオープンソースAI基盤、コンパイラ対応で前倒し整備へ

大規模言語モデル(LLM)を動かすための軽量推論ライブラリ「llama.cpp」を構成する「ggml」ライブラリにおいて、将来のIBMプロセッサ「POWER11」への対応準備が進んでいる。現在

読む →
Qualcomm Hexagon向けAI最適化が進む理由、モバイルとエッジAIの「小さな修正」が示す大きな地殻変動

Qualcomm Hexagon向けAI最適化が進む理由、モバイルとエッジAIの「小さな修正」が示す大きな地殻変動

AIモデルをスマートフォンやタブレットで動かす際、頭を悩ませるのがメモリの使い方と計算速度のバランスだ。今回、機械学習フレームワーク「llama.cpp」の開発リポジトリに投稿された一つの修正

読む →
生成AIの推論が「見えない」から「見える」へ、AWSの監視強化が変える運用常識

生成AIの推論が「見えない」から「見える」へ、AWSの監視強化が変える運用常識

AWSが生成AIの推論処理を詳細に可視化する新機能を実装した。モデルが本番環境でどのように振る舞い、どこで遅延やエラーが起きているのかをリアルタイムで追跡できる。これまでブラックボックス化しが

読む →
llama.cpp、Apple Silicon向けビルドでKleidiAIを有効化──マルチプラットフォーム推論の選択肢が一段と拡大

llama.cpp、Apple Silicon向けビルドでKleidiAIを有効化──マルチプラットフォーム推論の選択肢が一段と拡大

オープンソースの大規模言語モデル推論エンジン「llama.cpp」が、macOSのApple Silicon(arm64)向けビルドにおいて、ArmのAI最適化ライブラリ「KleidiAI」を

読む →
ChatGPT利用35歳以上が急拡大 2026年第1四半期に主流化進む

ChatGPT利用35歳以上が急拡大 2026年第1四半期に主流化進む

2026年第1四半期、ChatGPTの利用者層で35歳以上の伸びが全年齢層で最も高く、男女比も均衡に向かい、生成AIが幅広い世代と性別へ浸透する転換点を迎えたことが関係者の分析で明らかになった

読む →
LLMに多様な人格を付与する新手法

LLMに多様な人格を付与する新手法

空行 米バークレー大学などの研究チームは、大規模言語モデル(LLM)に現実的で多様な「仮想人格」を付与する新手法「Anthology」を開発した。従来のLLMは、特定のバイアスや均質的な回答傾

読む →
**llama.cppにWeb UIを常時同梱へ、Dockerビルドが変える「ローカルAI」の日常利用**

**llama.cppにWeb UIを常時同梱へ、Dockerビルドが変える「ローカルAI」の日常利用**

オープンソースの大規模言語モデル(LLM)推論フレームワーク「llama.cpp」において、DockerイメージのビルドプロセスにWebユーザーインターフェース(UI)が標準で組み込まれる変更

読む →
llama.cppが示す「マルチアーキテクチャ対応」の加速──s390x向けWeb UI事前ビルドが意味するもの

llama.cppが示す「マルチアーキテクチャ対応」の加速──s390x向けWeb UI事前ビルドが意味するもの

オープンソースの大規模言語モデル(LLM)推論コミュニティで最も活発なプロジェクトの一つ「llama.cpp」が、新たなリリースでs390xアーキテクチャ向けDockerイメージへのWeb U

読む →
AI制御の計画アルゴリズム革新

AI制御の計画アルゴリズム革新

カリフォルニア大学バークレー校の人工知能研究センター(BAIR)は、大規模な学習済み世界モデルを用いた長期的な計画立案を可能にする新しい勾配ベースのプランナー「GRASP」を開発した。近年、大

読む →
Googleの軽量AI「Gemma 4」向け修正が示す、MacとiPhoneでのAI動作改善の可能性

Googleの軽量AI「Gemma 4」向け修正が示す、MacとiPhoneでのAI動作改善の可能性

Googleが開発するオープンモデル「Gemma」シリーズの最新版において、特定の演算処理に関する脆弱性修正が行われた。この修正は、MacやiPhone、iPadといったApple製品上でAI

読む →
RISC-Vベクトル対応が512ビット・1024ビットへ拡大、CPU推論の競争軸が変わる

RISC-Vベクトル対応が512ビット・1024ビットへ拡大、CPU推論の競争軸が変わる

オープンソースの機械学習ライブラリ「llama.cpp」を構成するggml-cpuにおいて、RISC-Vアーキテクチャ向けのベクトル量子化処理が512ビットや1024ビットといった、より長いベ

読む →
CPU専用ビルドでLlama.cppが省く機能、Apple Silicon向けKleidiAIが無効化された意味

CPU専用ビルドでLlama.cppが省く機能、Apple Silicon向けKleidiAIが無効化された意味

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」の最新ビルド構成において、CPUバックエンド無効時に「cvector-generator」と「export-lora」の

読む →
llama.cpp、不要なチェックポイント復元を排除し推論効率向上へ

llama.cpp、不要なチェックポイント復元を排除し推論効率向上へ

大規模言語モデルを手元のパソコンやスマートフォンで動かすための軽量推論フレームワーク「llama.cpp」において、処理の無駄を省き、より高速な応答を実現するコード修正が行われた。この変更は、

読む →
AI推論がブラウザで3.4倍高速化、WebAssembly向け量子化演算の最適化が示すエッジAIの次なる競争軸

AI推論がブラウザで3.4倍高速化、WebAssembly向け量子化演算の最適化が示すエッジAIの次なる競争軸

ウェブブラウザ上で動作するAIの推論速度が、新たな最適化技術によって大幅に向上する可能性が出てきた。LLM推論を支える低ビット量子化演算に対し、WebAssembly SIMD128命令を活用

読む →
CPU推論の一部チェックポイント廃止、GoogleのAIモデル実行基盤「b9518」更新が示すエッジ推論の効率化潮流

CPU推論の一部チェックポイント廃止、GoogleのAIモデル実行基盤「b9518」更新が示すエッジ推論の効率化潮流

Googleが開発するAIモデル実行エンジンの最新コミット「b9518」から、オンデバイス推論の高速化技術「spec checkpoints」が一部プラットフォームで無効化された。サーバーサイ

読む →
ローカルAIの依存管理に変化、npmの動作条件がプロジェクト管理に与える影響が表面化

ローカルAIの依存管理に変化、npmの動作条件がプロジェクト管理に与える影響が表面化

ソフトウェア開発では、プロジェクトの依存関係を正確に再現することが品質と効率を左右する。今回、あるローカル実行型AIプロジェクトにおいて、 node_modules フォルダより packag

読む →
llama.cppの内部変数リファクタリング、マルチプラットフォーム推論の保守性向上へ

llama.cppの内部変数リファクタリング、マルチプラットフォーム推論の保守性向上へ

オープンソースの大規模言語モデル推論フレームワーク「llama.cpp」において、内部変数名を明確化するコード修正がマージされた。この変更は表面的な機能追加ではないが、多数のOSやハードウェア

読む →
llama.cppのコード修正に見る、オープンソースAI推論のマルチプラットフォーム戦略の現在地

llama.cppのコード修正に見る、オープンソースAI推論のマルチプラットフォーム戦略の現在地

生成AIのローカル実行を支える軽量推論エンジン「llama.cpp」に、ログ出力の書式指定子を修正する小規模な変更がマージされた。この変更自体は技術的には軽微だが、同時に表示された対応プラット

読む →
llama.cpp、Apple SiliconとKleidiAIの同時対応が示すエッジAI高速化の新常態

llama.cpp、Apple SiliconとKleidiAIの同時対応が示すエッジAI高速化の新常態

生成AIの推論をローカル端末で動かすための軽量ライブラリ「llama.cpp」の最新ビルド設定で、Apple Silicon向けにArmのKleidiAIを有効化したビルドターゲットが新たに確

読む →
推論モデル「LFM2/2.5」の応答漏れを修正 マルチプラットフォーム対応の信頼性が前進

推論モデル「LFM2/2.5」の応答漏れを修正 マルチプラットフォーム対応の信頼性が前進

対話型AIが、考えている途中で突然沈黙してしまう。そんなユーザー体験のストレスを減らす技術修正が、オープンソースの大規模言語モデル(LLM)推論エンジン「llama.cpp」に行われた。修正対

読む →
Llama.cppのマルチモーダル対応が進化、ユーザー指定モデルでダウンロード不要に

Llama.cppのマルチモーダル対応が進化、ユーザー指定モデルでダウンロード不要に

オープンソースのAI推論エンジン「llama.cpp」において、マルチモーダルモデル(画像認識などが可能なAI)の利用時に、ユーザーが独自に用意した画像処理用モデル(mmproj)を優先し、不

読む →
大規模言語モデルの推論効率を左右するKVキャッシュ管理に修正、Apple Silicon対応に影響

大規模言語モデルの推論効率を左右するKVキャッシュ管理に修正、Apple Silicon対応に影響

大規模言語モデル(LLM)を動かす際に使われる「KVキャッシュ」と呼ばれる仕組みに関する修正が、 llama.cpp の開発プロジェクトでマージされた。今回の変更は、モデルが文書生成をするとき

読む →
llama.cppのKVキャッシュ改善がスマホAIの実用速度を底上げする

llama.cppのKVキャッシュ改善がスマホAIの実用速度を底上げする

AIをパソコンやスマートフォンで動かすとき、応答が遅くなる大きな原因のひとつが「記憶領域」の扱いだった。今回、軽量AI推論エンジン「llama.cpp」に、この記憶領域のコピー処理を削減する変

読む →
SWA専用モデルが引き起こす内部バッファの欠落──StepFun系MTP推論で顕在化した技術課題

SWA専用モデルが引き起こす内部バッファの欠落──StepFun系MTP推論で顕在化した技術課題

大規模言語モデルの推論効率を高める「スライディングウィンドウ・アテンション(SWA)」を単独で使う設計が、ソフトウェア内部の想定外の空バッファを生み、ロード時に停止してしまう問題が修正された。

読む →
大規模AIのCIパイプラインが「コスト競争力」へ転換、Apple・OpenVINO・Arm対応で冗長ジョブ削減が加速

大規模AIのCIパイプラインが「コスト競争力」へ転換、Apple・OpenVINO・Arm対応で冗長ジョブ削減が加速

AIモデルの開発・テストを支える継続的インテグレーション(CI)の現場で、ジョブの重複や不要なビルドを整理し、限られた計算資源を最適配分する動きが顕在化している。Apple、OpenVINO、

読む →
Googleの軽量アシスタントモデル「Gemma 4」に、処理効率を高める新たな推論技術が統合される

Googleの軽量アシスタントモデル「Gemma 4」に、処理効率を高める新たな推論技術が統合される

Googleが公開する軽量AIモデル「Gemma」の最新バージョンに、テキスト生成の速度と効率を大幅に改善する技術が実装された。この変更は、モバイル端末やパソコン上で直接AIを動作させる「オン

読む →
米大学、タンパク質設計のAIモデルを発表

米大学、タンパク質設計のAIモデルを発表

2024年のノーベル化学賞は、AlphaFold2によるタンパク質構造予測の功績を称え、AIが生物学にもたらした革命的な影響を世界に示した。しかし、構造を「予測」する段階を超え、実際に新しいタ

読む →
DatabricksとAWSが実現するLLM微調整の新基盤

DatabricksとAWSが実現するLLM微調整の新基盤

ガバナンスを維持する分散処理の障壁 企業が大規模言語モデルを業務活用する際、最大の課題はデータの統制とセキュリティの両立である。Databricks の Unity Catalog で一元管理

読む →
GoogleがAndroid向け次世代AIエージェント発表 旅行予約や自動入力を実装

GoogleがAndroid向け次世代AIエージェント発表 旅行予約や自動入力を実装

米Googleは次世代AI機能群「Gemini Intelligence」を発表した。Android上で旅行の予約やウェブフォームへの自動入力、音声メモの文章化と推敲を単一のAIエージェントが

読む →
フロリダ州立大銃撃犯はChatGPTに訓練されたと提訴

フロリダ州立大銃撃犯はChatGPTに訓練されたと提訴

(注:文字数カウントで指定範囲に収めるため微調整しています) 米フロリダ州立大学(FSU)で発生した銃乱射事件を巡り、遺族がOpenAIを提訴した。訴状によると、犯人は実行前にChatGPTで

読む →
Apple、AI機能誤認で25億円の集団訴訟和解

Apple、AI機能誤認で25億円の集団訴訟和解

米アップルは、新機能「Apple Intelligence」の利用条件について顧客に誤解を与えたとする集団訴訟に対し、2億5000万ドル(約375億円)を支払うことで和解することを同意した。こ

読む →
Amazon Novaで製造文書26件の検索精度が向上

Amazon Novaで製造文書26件の検索精度が向上

航空宇宙業界の製造現場における文書管理の効率化が、生成AIのマルチモーダル技術で実証された。Amazon Nova Multimodal EmbeddingsとAmazon S3 Vector

読む →
ChatGPTが銀行口座情報を取得し家計分析を開始

ChatGPTが銀行口座情報を取得し家計分析を開始

Proユーザー限定でPlaid連携を導入、金融アドバイス機能の拡大か 米OpenAIは2026年、有料のChatGPT Proユーザー向けに銀行口座の取引データを分析する新機能の提供を開始した

読む →
ロボットが自律的に行動する世界モデルへ

ロボットが自律的に行動する世界モデルへ

米カリフォルニア大学バークレー校の研究チームが、人間の視点から見た映像と動作データを用いて未来の映像を予測する「PEVA」という新しい世界モデルを開発した。従来の技術は物理法則の理解や多段階の

読む →
AnthropicのMythosが暴いたサイバー攻撃の新たな現実

AnthropicのMythosが暴いたサイバー攻撃の新たな現実

Anthropicの最新AIモデル「Mythos」の登場が、世界の金融機関や政府機関に激震をもたらしている。しかし専門家らは、Mythosが生み出したのは新たな脅威ではなく、既に存在したサイバ

読む →
OpenAIが音声クローン新興企業を買収 著名人模倣の技術、本命はリアルタイム通訳か

OpenAIが音声クローン新興企業を買収 著名人模倣の技術、本命はリアルタイム通訳か

OpenAIは2026年5月、著名人の声を高精度に複製できるAI音声スタートアップWeights.ggを買収した。買収額は非公表だが、約6名のチーム全員がOpenAIに合流している。今回の動き

読む →
Android端末に自律的AI機能が本格搭載 Gemini Intelligenceでマルチアプリ操作が可能に

Android端末に自律的AI機能が本格搭載 Gemini Intelligenceでマルチアプリ操作が可能に

GoogleはAndroid向けAIアシスタント「Gemini」に大規模な機能拡張を実施した。新たに導入された「Gemini Intelligence」により、ユーザーの指示に対して端末が複数

読む →
AI動画分析でGeminiが勝利、ChatGPT・Claudeに差をつけた決定的理由

AI動画分析でGeminiが勝利、ChatGPT・Claudeに差をつけた決定的理由

生成AIはテキスト処理だけでなく、動画コンテンツの分析領域でも急速に進化している。ITmediaの姉妹サイトが実施した独自テストによると、GoogleのGemini、OpenAIのChatGP

読む →
GoogleがAndroidにGemini全面搭載、AppleのAI刷新前に布石

GoogleがAndroidにGemini全面搭載、AppleのAI刷新前に布石

Googleは最新のAndroidアップデートを通じて、自社の生成AI「Gemini」をスマートフォンやChromeブラウザ、ノートパソコン、さらには自動車に至るまで、あらゆるデバイスに横断的

読む →
MicrosoftがAI同士を競わせるWindows脆弱性発見システム投入

MicrosoftがAI同士を競わせるWindows脆弱性発見システム投入

【記事転載・引用防止用ダミー文】本記事は独自分析に基づく解説であり、元記事の全文翻訳ではない。 Microsoftは2026年5月、100体以上の特化型AIエージェントを相互競合させてソフトウ

読む →
GoogleがAI検索向けSEOの独自神話を否定 新興手法に反論

GoogleがAI検索向けSEOの独自神話を否定 新興手法に反論

Googleは2026年5月、AI検索に特化した最適化手法「GEO(Generative Engine Optimization)」や「AEO(Answer Engine Optimizati

読む →
Googleが生成AI時代のSEO神話を否定、従来型対策こそ有効と明言

Googleが生成AI時代のSEO神話を否定、従来型対策こそ有効と明言

米Googleは5月、AI検索に特化した新たなSEO手法として一部で提唱される「GEO(生成エンジン最適化)」や「AEO(回答エンジン最適化)」について、これらは単なる従来型SEOの言い換えに

読む →
ChatGPTが示した創発的モジュール性、AI構造設計に変革迫る新手法EMO

ChatGPTが示した創発的モジュール性、AI構造設計に変革迫る新手法EMO

OpenAIの研究者が発表した新たな事前学習手法「EMO」は、モデルが自律的に専門家構造を獲得する能力を示し、大規模言語モデルの設計論に一石を投じた。Mixture of Experts(Mo

読む →
AIの開放性が守る未来 ウイルス総研がオープンソースの重要性を強調

AIの開放性が守る未来 ウイルス総研がオープンソースの重要性を強調

サイバーセキュリティの未来は人工知能(AI)の「開放性」が握っている。ウイルス対策ソフトで知られる米ウイルス総研(VirusTotal)の幹部が、オープンソースのAIモデルこそが悪意ある攻撃か

読む →
OpenAIが示すAI時代のサイバー防御5つの行動計画

OpenAIが示すAI時代のサイバー防御5つの行動計画

情 OpenAIは、AIの普及が進む「インテリジェンス時代」に向けたサイバーセキュリティ強化策として、5つの柱からなる行動計画を発表した。AIを活用した防御技術の民主化と重要インフラ保護を軸に

読む →
主要AIモデルの83%がHugging Faceに集約、オープンソース開発の新潮流

主要AIモデルの83%がHugging Faceに集約、オープンソース開発の新潮流

2026年春時点で、主要な大規模言語モデル(LLM)の83%がHugging Face上で公開・共有されており、AI研究開発における同プラットフォームの一極集中が加速している。Hugging

読む →
Loop、全製品対象の40パーセント割引コードを発行 睡眠改善と集中需要を取り込み

Loop、全製品対象の40パーセント割引コードを発行 睡眠改善と集中需要を取り込み

ベルギーのウェアラブル耳栓メーカーLoop Earplugsは、主力製品のQuiet 2やギフトセットを含む全製品を対象とした40パーセント割引キャンペーンを開始した。騒音対策が睡眠の質や集中

読む →
マルチモーダル検索精度が大幅向上センテンストランスフォーマー最新動向

マルチモーダル検索精度が大幅向上センテンストランスフォーマー最新動向

センテンストランスフォーマー(Sentence Transformers)は、テキストと画像を統合的に処理できるマルチモーダル埋め込みモデルとリランカーモデルを相次いで公開した。これにより、異

読む →
OpenAIが個人情報検出フィルターを無償公開 検出精度で新基準

OpenAIが個人情報検出フィルターを無償公開 検出精度で新基準

OpenAIは4月10日、テキスト内の個人識別情報(PII)を高精度で検出し自動編集する「OpenAI Privacy Filter」を公開した。モデルの重みを完全公開するオープンウェイト方式

読む →
マルチモーダル埋め込みモデルが検索精度を変える理由

マルチモーダル埋め込みモデルが検索精度を変える理由

オープンソースのライブラリであるSentence Transformers(センテンス・トランスフォーマーズ)が、テキストと画像を同時に扱うマルチモーダル埋め込みモデルとリランカーモデルの学習

読む →
Hugging Face、学習後処理の新基盤TRL v1.0公開 拡張性と実運用を見据えた設計へ

Hugging Face、学習後処理の新基盤TRL v1.0公開 拡張性と実運用を見据えた設計へ

AI開発プラットフォームを運営するHugging Faceは、大規模言語モデルの学習後処理(ポストトレーニング)を担う中核ライブラリ「TRL(Transformer Reinforcement

読む →
Uplift Deskが最大570ドル割引、在宅勤務向け昇降デスクの春商戦

Uplift Deskが最大570ドル割引、在宅勤務向け昇降デスクの春商戦

在宅勤務の定着により、人間工学に基づくオフィス家具の需要が再燃している。米国のUplift Deskは春季セットアップセールを開始し、スタンディングデスクや人間工学チェアを含む主要製品を最大5

読む →
Visibleの5月プロモーション、1年超利用で合計400ドル超を節約

Visibleの5月プロモーション、1年超利用で合計400ドル超を節約

米国の格安通信事業者Visibleが2026年5月に提供するプロモーションコードの全容が明らかになった。新規契約者と長期利用者の双方を対象に、通信料金から合計400ドル超を削減できる仕組みであ

読む →