本文作者:kaifamei

一种MXM型智能加速模块的制作方法

更新时间:2025-03-25 19:55:07 0条评论

一种MXM型智能加速模块的制作方法


一种mxm型智能加速模块
技术领域
1.本发明属于智能加速领域,具体涉及一种mxm型智能加速模块。


背景技术:

2.随着人工智能领域与国产化趋势的不断发展,国产化计算机和国产化操作系统已经有了很大的提高,不仅可以适配国内外常用的办公软件,而且可以适配不同的算法模型,应用到不同的人工智能场景中。人工智能算法模型需要大量数据进行训练,并将训练好的模型部署到设备中,实现人脸识别、手势识别等功能,无论是算法模型的训练过程还是推理计算过程都需要进行大量的数据计算,对芯片的算力要求比较高。
3.嵌入式神经网络处理器(neural-network processing unit,npu)较于中央处理器(central processing unit,cpu)并行计算能力,数据处理速度快,更擅长处理视频、图像等海量数据,常用于人工智能领域算法的训练和推理。国内研制npu芯片的厂商中华为推出的atlas 200(ascend 310芯片)模块、寒武纪推出的思元270模块、百度推出的昆仑k100模块、比特大陆推出的sophon(bm1880芯片)模块等,都属于人工智能推理加速模块,广泛应用于智能监控、机器人、无人机、门禁闸机等场景。在这些场景中,将训练好的算法模型部署到终端设备中,通过智能加速模块对计算过程进行推理加速,可快速实现人脸识别、声纹识别、手势识别、异常行为分析的功能。
4.mxm即mobile pci express module,这是一套基于pci-express界面的、为图像处理器设计的设备接口,定位于不同类型的笔记本产品,是由nvidia及多家笔记本电脑生产商共同制定,采用和pci-express兼容的通讯协议,因此可适用于所有支持pci-express规格的绘图核心和支持pci-express绘图接口的芯片组,不仅缩短了产品设计的周期,而且可以根据场景需求而提供不同的mxm型智能加速模块。mxm接口定义是一套基于pcie信号规范来设计的,mxm型智能加速模块就可以作为pcie设备与主机通信,该规范是一套比较复杂的信号规范,主要包括视频信号(hdmi/dp)、pcie信号、电源信号和逻辑型信号。除了标准的信号,mxm协议规范还预留自定义的oem引脚,但为了保证不同厂家生产的芯片相互兼容一般只对标准的引脚进行定义。
5.由于不同厂家研制的npu芯片的架构和引脚定义不尽相同,不通用,需要二次开发才能使用,设计周期长。比如华为npu芯片采用昇腾架构、寒武纪npu芯片采用mluv02架构、百度npu芯片采用昆仑架构、比特大陆npu芯片采用bm1880架构,但都支持pcie协议、hdmi协议、usb协议等常见的数据传输信号协议,同时mxm接口规范是一套基于pcie信号规范来设计的,这让不同厂家生产的芯片通过同一种接口与主机通信成为了可能。


技术实现要素:

6.(一)要解决的技术问题
7.本发明要解决的技术问题是如何提供一种mxm型智能加速模块,以解决不同厂家生产的npu芯片,内部架构和对外引脚定义不尽相同,不通用的问题。
8.(二)技术方案
9.为了解决上述技术问题,本发明提出一种mxm型智能加速模块,该智能加速模块包括atlas200模块、sd card、phy芯片、电压转换模块及mxm连接器;
10.atlas 200模块为ai加速模块,集成了海思ascend 310ai处理器,该处理器包括8gb内存和64mb spi flash,对外提供pcie3.0 x4、rgmii、emmc/sd3.0、usb2.0/3.0、i2c、spi以及通用gpio接口;
11.mxm连接器为该智能加速模块提供12v电压,经过板内电压转换模块二次转换后输出多种电压给各模块供电;
12.mxm连接器通过pcie3.0x4、usb2.0/3.0、spi以及通用gpio接口直接连接到atlas 200模块;
13.mxm连接器通过以太网连接phy芯片,phy芯片通过rgmii接口协议与atlas200模块实现数据传输;
14.mxm连接器通过uart连接到txs0108e芯片,txs0108e芯片通过i2c总线接口与atlas 200模块实现数据传输;
15.sd card通过emmc/sd3.0接口协议与atlas 200模块实现数据传输。
16.进一步地,mxm连接器为mxm 6h 314p芯片。
17.进一步地,电压转换模块为jpm4644和js74401芯片。
18.进一步地,phy芯片为88e1512芯片,该芯片支持rgmii模式,支持10mbps、100mbps、1000mbps自适应,支持1000base-t和1000base-x两种模式的千兆网。
19.进一步地,该智能加速模块的结构尺寸符合mxm 3.1标准,type b规范,对外有281个引脚。
20.进一步地,该智能加速模块包括1路pcie x4、2路uart、2路i2c、3路gpio、2路pwm、1路usb3.0、1路usb2.0、1路1000base-t和1路1000base-x。
21.进一步地,外部电源通过mxm连接器给智能加速模块提供12v电压,经过板内电压转换模块二次转换后输出多种电压给各模块供电,各模块内部控制各电压的上电顺序。
22.进一步地,12v直流电压通过jpm4644、bl8033cb6tr电压转换模块转换为3.8v/10a、5v/1a和5v/2a,3.8v/10a直流电压通过js74401电压转换模块转换为1.0v/1a、1.8v/1a和3.3v/2a,5v/1a直流电压通过bl1117-33ax电压转换模块转换为3.3v/0.5a,5v/2a直流电压通过js74401转换为3.3v/2a。
23.进一步地,该智能加速模块能作为主板的协处理器,也能在rc模式独立使用,通过拨码开关切换为ep、rc两种工作模式.
24.进一步地,在ep工作模式下,该智能加速模块作为从设备,通过pcie接口与主机通信,实现深度学习复杂的计算过程,并将结果返回给主机;在rc工作模式下,通过sd card启动智能加速模块。
25.(三)有益效果
26.本发明提出一种mxm型智能加速模块,本发明设计了一种mxm型智能加速模块,是采用国产npu模块为核心的自主设计的智能加速模块,能够实现对主流ai算法模型的支持及推理过程的加速,模块所有核心器件全部采用国产器件,可适配国产化计算机和国产化操作系统。本发明提出遵循mxm接口规范的智能加速模块,设计的npu模块即可以工作在rc
模式,也可以工作在ep模式;设计的插拔式mxm型接口既保证npu模块与连接器紧配合,保证数据传输的稳定性,又具有组装便捷、更换方便的优点。插拔式mxm型接口可实现npu模块与连接器之间的紧配合,提高了组件之间使用的便捷性和更换的灵活性,基于mxm3.1标准的type b规范,定义部分管脚点位,实现npu模块通过mxm连接器与主机之间的通信。
附图说明
27.图1为本发明mxm型智能加速模块连接示意图;
28.图2为本发明mxm型智能加速模块电压转换示意图;
29.图3为本发明mxm型智能加速模块结构尺寸(符合mxm3.1规范)示意图。
具体实施方式
30.为使本发明的目的、内容和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
31.本发明设计的一种mxm型智能加速模块,属于智能加速模块领域,可实现不同人工智能应用场景的推理加速,既可以工作在rc模式,也可以工作在ep模式。在rc模式情况下,该智能加速模块可以独立运行,通过sd card启动智能加速模块;在ep模式下,该智能加速模块作为从设备通过pcie接口与主机通信。插拔式mxm型接口可实现npu模块与连接器之间的紧配合,提高了组件之间使用的便捷性和更换的灵活性,基于mxm3.1标准的type b规范,定义部分管脚点位,实现npu模块通过mxm连接器与主机之间的通信。本发明设计的一种mxm型智能加速模块,主要包括npu模块、mxm连接器、电压转换模块、phy芯片,其中npu模块选用华为生产的atlas 200模块,mxm连接器选用得润电子生产的mxm 6h 314p芯片,电压转换模块选用中电58所生产的jpm4644和js74401芯片,phy芯片选用marvell生产的88e1512芯片。
32.本发明设计的一种mxm型智能加速模块选用华为atlas 200为核心的自主设计的智能算法推理加速模块,能够实现对主流ai算法模型的支持及推理过程的加速,模块所使用核心器件全部采用国产器件。mxm接口规范符合pcie信号规范,mxm型智能加速模块就可以作为pcie设备与主机通信。
33.一种mxm型智能加速模块连接示意图如图1所示,包括atlas200模块、sd card、phy芯片、电压转换模块及mxm连接器。
34.其中atlas 200模块为ai加速模块,是一款高性能的ai智能计算模块,集成了海思ascend 310ai处理器,该处理器主要包括8gb内存和64mb spi flash,算力可达16t@int8,对外提供pcie3.0 x4、rgmii、emmc/sd3.0、usb2.0/3.0、i2c、spi以及通用gpio等接口;phy芯片选用88e1512,该芯片支持rgmii模式,支持10mbps、100mbps、1000mbps自适应,支持1000base-t和1000base-x两种模式的千兆网。
35.mxm连接器可以给智能加速模块提供12v电压,经过板内电压转换模块二次转换后输出多种电压给各模块供电;
36.mxm连接器通过pcie3.0 x4、usb2.0/3.0、spi以及通用gpio等接口直接连接到atlas 200模块;
37.mxm连接器通过以太网连接phy芯片,phy芯片通过rgmii接口协议与atlas200模块实现数据传输;
38.mxm连接器通过uart连接到txs0108e芯片,txs0108e芯片通过i2c总线接口与atlas 200模块实现数据传输;
39.sd card通过emmc/sd3.0接口协议与atlas 200模块实现数据传输。
40.一种mxm型智能加速模块连接示意图如图2所示,外部电源通过mxm连接器给智能加速模块提供12v电压,经过板内电压转换模块二次转换后输出多种电压给各模块供电,各模块内部控制各电压的上电顺序。12v直流电压通过jpm4644(cd/cd)、bl8033cb6tr(cd/cd)电压转换模块转换为3.8v/10a、5v/1a和5v/2a,3.8v/10a直流电压通过js74401(ldo)电压转换模块转换为1.0v/1a、1.8v/1a和3.3v/2a,5v/1a直流电压通过bl1117-33ax(ldo)电压转换模块转换为3.3v/0.5a,5v/2a直流电压通过js74401(ldo)转换为3.3v/2a。
41.一种mxm型智能加速模块结构尺寸示意图如图3所示,本文设计的mxm型智能加速模块结构尺寸符合mxm 3.1标准,type b规范,对外有281个引脚,不计散热片高度尺寸(长*宽*高)=105mm*82mm*15mm。
42.一种mxm型智能加速模块点位定位如表1-4所示,在符合mxm 3.1标准,type b规范的基础上,对点位定义,包括1路pcie x4、2路uart、2路i2c、3路gpio、2路pwm、1路usb3.0、1路usb2.0、1路1000base-t、1路1000base-x等。
43.一种mxm型智能加速模块可以作为主板的协处理器,也可以在rc模式独立使用,通过拨码开关可切换为pcie(ep)、rc两种工作模式。在ep工作模式下,智能加速模块作为从设备,通过pcie接口与主机通信,主要实现深度学习复杂的计算过程,并将结果返回给主机;在rc工作模式下,通过sd card启动智能加速模块。
44.表1 mxm型智能加速模块点位定义(1)
45.pinsignalnamemxm310pinsignalnamemxm310e1pwr_src12ve2pwr_src12ve3gndgnde4gndgnd15v 2prsnt_r#prsnt_r#35v 4wake#wake#55v 6pwr_goodpwr_good75v 8pwr_enpwr_en95v 1027mhz_ref 11gndgnd12gndgnd13gndgnd14lvds_u_hpd 15gndgnd16jtag_testen 17gndgnd18pwr_level 19pex_std_sw#pex_std_sw#20th_overt# 21vga_disable# 22th_alert# 23pnl_pwr_enuart0_rxd24th_pwmpwm025pnl_bl_enuart0_txd26gpio0gpio027pnl_bl_pwmpwm128gpio1gpio129hdmi_cec 30gpio2gpio231lvds_l_hpd 32smb_dati2c1_sda
103pex_rx6# 104pex_tx6 105pex_rx6 106gndgnd107gndgnd108pex_tx5# 109pex_rx5# 110pex_tx5 111pex_rx5 112gndgnd113gndgnd114pex_tx4# 115pex_rx4# 116pex_tx4 117pex_rx4 118gndgnd119gndgnd120pex_tx3#pex_tx3#121pex_rx3#pex_rx3#122pex_tx3pex_tx3123pex_rx3pex_rx3124gndgnd125gndgnd126key 127key 128key 129key 130key 131key 132key 133gndgnd134gndgnd135pex_rx2#pex_rx2#136pex_tx2#pex_tx2#137pex_rx2pex_rx2138pex_tx2pex_tx2139gndgnd140gndgnd141pex_rx1#pex_rx1#142pex_tx1#pex_tx1#143pex_rx1pex_rx1144pex_tx1pex_tx1
49.注:signal name为mxm3.1规范标准定义,mxm310为本发明智能加速模块点位定义,mxm310列未给出定义的信号为nc。
50.表3 mxm型智能加速模块点位定义(3)
51.[0052][0053]
注:signal name为mxm3.1规范标准定义,mxm310为本发明智能加速模块点位定义,mxm310列未给出定义的信号为nc,标红部分为调试接口;mdi*信号是1000base-t信号定义(mxm板卡设计网络变压器);s_*信号是1000base-x信号定义。
[0054]
表4 mxm型智能加速模块点位定义(4)
[0055][0056][0057]
注:signal name为mxm3.1规范标准定义,mxm310为本发明智能加速模块点位定义,mxm310列未给出定义的信号为nc。
[0058]
本文设计并实现了一种mxm型智能加速模块,符合mxm结构规范,大部分管脚兼容mxm接口规范,支持pcie信号规范,npu模块选用华为atlas 200模块的智能加速模块,可以应用于机器人、无人机、视频监控场景中对人脸识别、声纹识别、手势识别算法模型推理过
程的加速。根据不同应用场景的需要可以更换其他厂商研制的npu芯片,具有产品设计周期短、更换方便快捷等特点。
[0059]
本发明设计了一种mxm型智能加速模块,是采用国产npu模块为核心的自主设计的智能加速模块,能够实现对主流ai算法模型的支持及推理过程的加速,模块所有核心器件全部采用国产器件,可适配国产化计算机和国产化操作系统。本发明提出遵循mxm接口规范的智能加速模块,设计的npu模块即可以工作在rc模式,也可以工作在ep模式;设计的插拔式mxm型接口既保证npu模块与连接器紧配合,保证数据传输的稳定性,又具有组装便捷、更换方便的优点。
[0060]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-8-978-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2022-11-27 21:23:55

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论