▽池田信夫 blog ●01/29 00:47 2025年01月28日07:00ITDeepSeekの衝撃:NVIDIA株価急落の背後にある真実とは?2025年1月27日、AI分野に激震が走った。新興企業DeepSeekが「最先端のGPUを必要としない並列処理技術」を発表し、NVIDIAの株価が急落。これにより、生成AI業界におけるGPUの優位性に疑問が投げかけられる事態となった。この出来事が、特に大規模言語モデル(LLM: Large Language Model)の構造に与える影響を中心に考察する(ChatGPT)。1. 大規模言語モデルの構造とGPU依存の背景大規模言語モデルは、その名の通り、膨大な数のパラメータを持つ。これらのモデルの中核をなすのがトランスフォーマーアーキテクチャであり、以下の計算が頻繁に行われる。自己注意機構(Self-Attention): 入力トークン間の関係性を計算する。大規模な行列演算:
▽ケータイ Watch ●01/24 12:45 1月24日(金) 12:37 更新キャリアドコモarrowsドコモ、「らくらくスマートフォン F-53E」を1月30日に発売12:21キャリアソフトバンクLINEMOLINEMOの2つのキャンペーンで特典増額、~2月4日12:17キャリアソフトバンクアプリ・サービスソフトバンク、個人情報の流出や迷惑電話を検知する「セキュリティパックプレミアム」12:30キャリアドコモアプリ・サービス毎月500ポイント還元のキャンペーン、dアカウントとマネックス証券口座連携で12:22キャリアドコモNTTドコモが、世界最大のモバイル関連展示会「MWC Barcelona 2025」に出展12:10サンワサプライから、最大45WのPD充電可能なUSBハブ発売合計最大出力160W、ラトックシステムから最大10台まで同時充電できるUSB充電ステーション発売アプ