我想炫耀-天天影视圈 比GPU快几百倍!曦智科技首发新一代光电混统统较卡:128×128光子矩阵
你的位置:我想炫耀 > 漫展偷拍 > 天天影视圈 比GPU快几百倍!曦智科技首发新一代光电混统统较卡:128×128光子矩阵
天天影视圈 比GPU快几百倍!曦智科技首发新一代光电混统统较卡:128×128光子矩阵
发布日期:2025-07-06 10:37    点击次数:188

天天影视圈 比GPU快几百倍!曦智科技首发新一代光电混统统较卡:128×128光子矩阵

快科技 3 月 26 日音尘天天影视圈,曦智科技今天负责发布全新光电混统统较卡"曦智天枢",初度终明晰光电混统统较在复杂交易化模子中的应用。

曦智科技是各人跨越的光电混划算力提供商,在集成光子领域赢得了始创性的阻扰,掌合手了光子矩阵计较 ( oMAC ) 、片上光采集 ( oNOC ) 、片间光采集 ( oNET ) 三大中枢本事,打造了光子计较、光子采集两各人具线。

2021 年 12 月,曦智科技初度对外发布光电混统统较家具,得手考证了光电混统统较在特定算法下,相较于主流 GPU 的速率上风多达数百倍。

曦智科技觉得,光电羼杂将会为东谈主工智能、大言语模子、智能制造等领域带来算力调动。

本次发布的曦智天枢,深度交融了光芯片、电芯片各自的上风,并领受 3D 先进封装本事,赈济可编程。

它在光电集成度、光子矩阵领域、精度、可编程性等方面,齐比前代家具终明晰彰着的性能普及。

比如在赈济科学计较(如伊辛算法)基础上,加强了关于 ResNet50 等交易算法应用的赈济,既保持了光计较上风,还大幅普及了家具通用适配性。

天枢领受非干系架构,不仅易于系统扩张,还具备出色的抗打扰材干、更高的计较精度。

天天影视圈

它的中枢科罚器包括光学科罚单位(OPU)、电学专用集成电路(ASIC),光芯片和电芯片通过 3D TSV 硅通孔、FlipChip 倒装芯片封装本事进行整合、协同使命,可显赫缩短延长、普及信号传输完满性,其中光芯单方面积达到 600 平时毫米,比上代增大 3 倍。

芯片主频为 1GHz,输出精度 8bit,比上代普及 8 倍。

光芯片上的器件数目超 4 万个,但器件尺寸进一步削弱,集成度显赫普及。

最大可赈济 128x128 矩阵领域,是上一代 64×64 的 4 倍,运算材干、生动性齐得到了极大的普及。

勾引

此外,用户不错通过 API 解放设立计较矩阵所有,领有更强的稳健性和优化空间。

据悉,光子计较是一种被迫运算,运算任务在光通过光子矩阵的经由中即可完成,颠覆了传统 CMOS 电子芯片的运算逻辑。

光子芯片的性能普及与光子矩阵领域、主频速率、波长数目等参数干系,而不依赖晶体管的密度及芯片制程的普及。

曦智科技还初度建议了等效光算力(EOPP)表率,是一种考虑了矩阵领域、输出精度、权重刷新速率等的综划算力评价依次,比较刻下主流的电芯片方向计较依次,更合乎光计较的旨趣和脾性。

软件方面,天枢搭载了曦智光电混统统较软件栈,算子库包含 RVV ( RiscV Vector ) 算子,电矩阵 ( dMAC ) 加快算子、光矩阵 ( oMAC ) 加快算子,赈济 CV 类和 LLM 类模子,以及包括 Ising、LineSolver 在内的 non-AI 算子。

用户借助曦智编译器,不错生动地诓骗这些算子来构建高效的应用模子。

此外,平台还赈济用户自界说算子,通过 OpenCL C/C++ 言语进行编译和优化,进一步扩张了算法缔造的生动性。

曦智科技的软件栈与 Pytorch、ONNX 等主流框架深度集成,可通过软件栈平直使用天枢的光矩阵和电矩阵加快单位对模子和算法进行加快和考证,也不错将模子通过曦智编译框架编译部署在端侧进行推理。

通过软件栈,天枢得手运转了 ResNet50 深度卷积神经采集模子、Llama 2 AI 大言语模子,初度终明晰光电混统统较在交易化场景中的应用。

现在,曦智科技已启动下一代光电混统统较家具的研发,将会进一步普及计较材干。

天天影视圈

相关资讯