基盤モデル

最新記事

基盤モデル 6/17 一次情報

金融決済の“行動パターン”をAIが学習する時代へ──NVIDIAが取引基盤モデルの構築手法を公開

クレジットカードの利用履歴や送金のたびに蓄積される取引データは、人の行動を映し出す鏡だ。しかし多くの金融機関では、不正検知や与信判断を人手で設計したルールや静的な特徴量に頼ってきた。NVIDI

推論モデル

マルチモーダル

オープンモデル

モデル価格

最新記事

金融決済の“行動パターン”をAIが学習する時代へ──NVIDIAが取引基盤モデルの構築手法を公開

医療AIの「聞き間違い」をどう防ぐか──合成音声で評価を高速化するNVIDIAの新手法

ChatGPTの「健康相談」、無料ユーザーにも高度な判断力が届く構造に

GPT‑5.4が創薬化学の難反応を改善、自律型AI実験室が研究の「相棒」に

稀な遺伝病の診断にAI推論モデルが進展、未解決事例から18件の新たな診断を導く

ラック単位で推論コストが10分の1に──CoreWeaveがNVIDIA Vera Rubinで示すAIインフラの新水準

ChatGPTの「記憶」が脱メモ化、会話の全体像から文脈を自動構成する仕組みへ

CoreWeave、Moonshot AIの最新コーディングモデルで最速推論を達成 価格性能競争が新段階に

住宅ローン申請の「見えない待ち時間」を削る──Rocket CloseがAWSで構築したAIエージェントの実力

合成3D医療画像がもたらすラジオロジーAIの寡占化構造

OpenAIのGPT-5.5を含む最先端モデル、AWS上で一般提供開始 エンタープライズAI導入の「調達と運用」障壁が変わる

AnthropicがOpus 4.8で狙う「長時間協働」、エージェント性能と速度の両立が示す競争軸の変化

クロード導入支援に「格付け」、Anthropicが企業向けパートナー制度を再編──案件実績で3段階の選別へ

NVIDIAの通信事業者向けAI工場で進むトークン課金型サービスの構造変革

三菱UFJ銀行が全社AI基盤にOpenAI採用、約3万5000人に展開──金融の「AIネイティブ化」へ始動

表データ専用AI「NEXUS」がAWSに登場、数カ月かかった予測が数日で完了する構造変化

BBVAが10万人の社員にChatGPT Enterpriseを展開、銀行業務をAIで再設計する「The Eight」構想の全容

チャットボット以外でも成果を上げる直接選好最適化──OCR分野でテキスト崩壊率を6割削減

GPT‑Rosalindの新展開、創薬ワークフローを直接支援するAIへ─評価指標も独自設計

大規模言語モデルの高速化競争、「待ち時間」を根こそぎ減らす並列推測技術がAWSから登場

AIラジオ局が暴く生成AIの自律運用リスク 人間の監視なしでは誤情報拡散

xAIが長期タスク向け新モデル「Composer 2.5」を提供開始、コーディングAIの競争軸が「速さ」から「複雑さへの対応力」へ

OpenAIが生物学特化のAI「GPT‑Rosalind」を本格展開、ワクチン開発とバイオ防衛が次の競争軸に

Ollamaが大規模言語モデル通信の安定性を改善、サーバー側無通信時の仕様変更に対応

ChatGPT Enterpriseに「使った分を見える化」機能、大企業のAIコスト管理が新段階へ

3B級の小型AIで動く「経済シミュレーション」が示した、大規模モデルだけでは見えない競争軸

Open WebUIがデスクトップ化と自動化で変える推論基盤レイヤー

Open WebUI端末機能の大幅拡張が示すノーコードAI開発基盤の方向性

不正競争の相手は人間ではなく機械になった。AIが見つける脆弱性と、AIが悪用する脆弱性のはざまで、企業の防御モデルは根本的な再設計を迫られている。

【AI経済新聞】

グロックがクイックコマースにAIを直接組み込む、「買う前に届く」次世代ショッピング体験が始動

CrewAIの最新プレリリースが示す「マルチAIエージェント」開発基盤の地殻変動

Grok 4.3がAWS Bedrockに登場、AIエージェントの「幻覚」競争に新基準

Ollama v0.30.4、中国発・中東発LLMの統合加速——ローカル推論基盤で進むマルチモデル対応

画像ダウンロード遅延を解消、SageMaker AIのコンテナキャッシュが生成AI推論の「2倍高速スケーリング」を実現

vLLM、推論テストの「無応答」を自動検出し早期停止する仕組みを導入──大規模LLM運用の信頼性向上へ

LangChain 1.3.1が示す「マルチクラウドLLM」運用の地殻変動

NISTの制御カタログ改訂がソフトウェア更新の供給網を変える理由

Microsoftのマルチエージェント基盤AutoGenが示すAI開発の分業化加速

100万トークンの壁を越えるGLM-5.2、長期タスクで「実用できるオープンソース」へ

xAIの動画生成が6秒をわずか25秒に——「製作現場」を狙う第2世代の本気

Carbon 3BのDNAトークナイザーがllama.cppを変える理由

Oracleのクラウド予算でOpenAIのAIを使える道、企業調達に「2社まとめ買い」の選択肢

クアルコムHexagonチップで推論高速化が進む理由

AWSの推論ルーティングが変える欧州AI利用、「待たされない基盤モデル」が企業の新常識に

HunyuanOCR統合が変える視覚推論 マルチモーダル分岐廃止の狙い

LangChain OpenAI 1.2.2が示すLLM仲介層の自動修復機能と低レイヤー依存の現実

Strandsが画像理解評価基盤を刷新する理由

タイトル：AWS顧客の9割が選ぶ基盤モデル提供元に新展開

生成AIで稼ぐ金融の壁、PalantirとTWGが実装した1220億円受注にみるAI導入の構造転換

企業の手元データを動かさずAIを育てる「NVIDIA FLARE」が示す、次のAI開発インフラ競争

vLLM 0.20.1が示す推論基盤の異変、DeepSeek V4最適化の理由

LangChain 1.3.4が修正した「人間の判断を仰ぐ機能」の拒否応答、AIエージェント信頼性の基盤に進展

MicrosoftのAutoGenが示すマルチAIエージェント基盤の再構築 バージョン0.7.3分岐の真意

金融機関が個別AIから「取引基盤モデル」へ収れんする理由——サイロ化を超える次の競争軸

イーロンマスクのxAIがSpaceXと提携する構造的理由

Google Beamが示す会議室ハードウェアと生成AIの融合点

Microsoftのpyautogen v0.10.0公開とマルチエージェント開発環境が整う理由

【記事タイトル】

推論性能と実用性を両立、次世代AIエージェント開発の選択肢が拡大する

生成AIフレームワーク「LangChain」1.3.10が示す、モデル多様化時代の地味だが決定的な布石

vLLMがDockerイメージの依存関係を整理、推論エンジンの安定性向上へ一手

DeepSeek-V4の初期化を修正、vLLMが推論エンジンとして次世代モデル対応を加速

Open WebUI 0.9.5が塞ぐ3つの攻撃経路とSSRF対策

LLM軽量化の共通処理に集約の動き、Apple Siliconから国産CPUまで単一コードで対応へ

LangChain、バージョン追跡を自動化──エコシステムの「見えない依存関係」が透明になる瞬間

エッジAIで自律動作が加速、NVIDIA JetPack 7.2が示すメモリ効率と実世界エージェントの新段階

MTP推論がllama.cppに統合、投機的デコーディングの無駄を削減

llama.cpp推論最適化がMTPと投機的復号を強化する理由

llama.cppのテストアーキテクチャ変更が示す推論基盤の品質戦略

オープンソースLLM実行基盤「llama.cpp」のビルドb9441、MSVCコンパイラのETag処理バグを修正し配信安定性が向上

LGのEXAONE 4.5がllama.cppに対応、マルチモーダル推論のローカル実行が現実的に

LangChainがコールバックのコンテンツブロック対応を強化、マルチモーダル開発の基盤に変化

自動運転AIの「走りながら学ぶ」時代へ、NVIDIAが閉ループ学習基盤を公開した意味

CoreWeave、Moonshot AIの最新コーディングモデルで最速推論を達成価格性能競争が新段階に

OpenAIのGPT-5.5を含む最先端モデル、AWS上で一般提供開始エンタープライズAI導入の「調達と運用」障壁が変わる

AIラジオ局が暴く生成AIの自律運用リスク人間の監視なしでは誤情報拡散

HunyuanOCR統合が変える視覚推論マルチモーダル分岐廃止の狙い

MicrosoftのAutoGenが示すマルチAIエージェント基盤の再構築バージョン0.7.3分岐の真意

NTTデータが200種超のAI活用事例を公開提案プロセス短縮の理由

llama.cppのMTP推論で不要コピー排除巨大言語モデルの推論速度が変わる軽量化

AMD Zen系CPU向けのAI推論、8ビット量子化で高速化と省メモリを両立エッジデバイスでのLLM活用がさらに現実的に

OpenAI訴訟マスク対アルトマン法廷闘争激化