▽池田信夫 blog - ライブドアブログ ●01/29 00:47 2025年01月28日07:00ITDeepSeekの衝撃:NVIDIA株価急落の背後にある真実とは?2025年1月27日、AI分野に激震が走った。新興企業DeepSeekが「最先端のGPUを必要としない並列処理技術」を発表し、NVIDIAの株価が急落。これにより、生成AI業界におけるGPUの優位性に疑問が投げかけられる事態となった。この出来事が、特に大規模言語モデル(LLM: Large Language Model)の構造に与える影響を中心に考察する(ChatGPT)。1. 大規模言語モデルの構造とGPU依存の背景大規模言語モデルは、その名の通り、膨大な数のパラメータを持つ。これらのモデルの中核をなすのがトランスフォーマーアーキテクチャであり、以下の計算が頻繁に行われる。自己注意機構(Self-Attention): 入力トークン間の関係性を計算する。大規模な行列演算: