当前所在位置:首页 > 联华证券配资

英伟达被“偷家”?全新AI芯片横空出世 速度比GPU快十倍

2331

2024-06-04 【 字体:

K图 NVDA_0

  芯片推理速度较英伟达GPU提高10倍、成本只有其1/10;运行的大模型生成速度接近每秒500 tokens,碾压ChatGPT-3.5大约40 tokens/秒的速度——短短几天,一家名为Groq的初创公司在AI圈爆火。

  Groq读音与马斯克的聊天机器人Grok极为接近,成立时间却远远早于后者。其成立于2016年,定位为一家人工智能解决方案公司。

  在Groq的创始团队中,有8人来自仅有10人的谷歌早期TPU核心设计团队。例如,Groq创始人兼CEO Jonathan Ross设计并实现了TPU原始芯片的核心元件,TPU的研发工作中有20%都由他完成,之后他又加入Google X快速评估团队,为谷歌母公司Alphabet设计并孵化了新Bets。

image

  虽然团队脱胎于谷歌TPU,但Groq既没有选择TPU这条路,也没有看中GPU、CPU等路线。Groq选择了一个全新的系统路线——LPU(Language Processing Unit,语言处理单元)。

  “我们(做的)不是大模型,”Groq表示,“我们的LPU推理引擎是一种新型端到端处理单元系统,可为AI大模型等计算密集型应用提供最快的推理速度。”

  从这里不难看出,“速度”是Groq的产品强调的特点,而“推理”是其主打的细分领域。

  Groq也的确做到了“快”,根据Anyscale的LLMPerf排行显示,在Groq LPU推理引擎上运行的Llama 2 70B,输出tokens吞吐量快了18倍,由于其他所有云推理供应商。

image

  第三方机构artificialanalysis.ai给出的测评结果也显示,Groq的吞吐量速度称得上是“遥遥领先”。

image

  为了证明自家芯片的能力,Groq还在官网发布了免费的大模型服务,包括三个开源大模型,Mixtral 8×7B-32K、Llama2-70B-4K和Mistral 7B - 8K,目前前两个已开放使用。

  LPU旨在克服两个大模型瓶颈:计算密度和内存带宽。据Groq介绍,在 LLM 方面,LPU较GPU/CPU拥有更强大的算力,从而减少了每个单词的计算时间,可以更快地生成文本序列。此外,由于消除了外部内存瓶颈,LPU推理引擎在大模型上的性能比GPU高出几个数量级。

  据悉,Groq芯片完全抛开了英伟达GPU颇为倚仗的HBM与CoWoS封装,其采用14nm制程,搭载230MB SRAM,内存带宽达到80TB/s。算力方面,其整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。

  值得注意的是,“快”是Groq芯片主打的优点,也是其使用的SRAM最突出的强项之一。

  SRAM是目前读写最快的存储设备之一,但其价格昂贵,因此仅在要求苛刻的地方使用,譬如CPU一级缓冲、二级缓冲。

  华西证券指出,可用于存算一体的成熟存储器有Nor Flash、SRAM、DRAM、RRAM、MRAM等。其中,SRAM在速度方面和能效比方面具有优势,特别是在存内逻辑技术发展起来之后,具有明显的高能效和高精度特点。SRAM、RRAM有望成为云端存算一体主流介质。

阅读全文
相关推荐

禁止增信服务变相加价,助贷新规将如何重塑行业格局

禁止增信服务变相加价,助贷新规将如何重塑行业格局
助贷新规落地,金融监管总局四大维度重塑行业格局。日前,国家金融监管总局发布《关于...

美股新能源汽车股集体下跌:小鹏汽车跌超10%,蔚来汽车跌11%

美股新能源汽车股集体下跌:小鹏汽车跌超10%,蔚来汽车跌11%
查看最新行情   新浪科技讯 北京时间3月5日晚间消息,截至...

将军的假牙不翼而飞,警卫员心虚冒汗,承认:“我拿去卖了75元”_司令_民国时期_战友

将军的假牙不翼而飞,警卫员心虚冒汗,承认:“我拿去卖了75元”_司令_民国时期_战友
上世纪50年代,工程兵司令清理假牙,夜里假牙不翼而飞。司令派人调查,发现:“警卫...

传设计初创公司Figma完成二次股票出售 公司估值达125亿美元

传设计初创公司Figma完成二次股票出售 公司估值达125亿美元
智通财经APP获悉,据知情人士透露,包括Coatue Management、Al...

重磅数据来袭,黄金是突破3344还是回踩3245?紧盯这一信号!

重磅数据来袭,黄金是突破3344还是回踩3245?紧盯这一信号!
汇通财经APP讯——周三(4月30日),现货黄金市场交投谨慎,价格围绕3300美...

未来六天南方大部多降雨和强对流 或对沪昆二广等高速有不利影响

未来六天南方大部多降雨和强对流 或对沪昆二广等高速有不利影响
  未来六天(5月5日至10日),江南、华南和贵州等地降雨连连,局地雨势猛烈,且...

英镑美元分析:英镑上涨存两大“不安因素” 短线依旧看空!

英镑美元分析:英镑上涨存两大“不安因素” 短线依旧看空!
周一(5月21日),英镑/美元扩大跌势,现逼近1.34整数关。早盘美元指数续刷5...

财报前瞻 面临激烈竞争 Snowflake(SNOWUS)Q2业绩能否超预期

财报前瞻  面临激烈竞争 Snowflake(SNOWUS)Q2业绩能否超预期
智通财经获悉,Snowflake(SNOW.US)将于当地时间周三公布2025财...

林徽因和她的同学们,追寻中国第一代建筑师的故事与精神

林徽因和她的同学们,追寻中国第一代建筑师的故事与精神
今年5月,美国宾夕法尼亚大学韦茨曼设计学院为已故中国著名建筑师林徽因追授建筑学学...

4月2日基金净值:天弘国证A50指数A最新净值08213,跌023%

4月2日基金净值:天弘国证A50指数A最新净值08213,跌023%
证券之星消息,4月2日,天弘国证A50指数A最新单位净值为0.8213元,累计净...