完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
|
|
相关推荐
1个回答
|
|
Linux内核新增的异构内存管理将解锁加速GPU的新途径,并挖掘其它的机器学习硬件的潜能,一项开发了很久的内存管理技术将会给机器学习和其它GPU驱动的程序很大幅度的提升,而它也将在接下来的几个版本中进入Linux内核。
异构内存管理(HMM)可以允许设备驱动为在其自身内存管理下的进程镜像地址空间。正如红帽的开发者JérômeGlisse所解释的,这让像GPU这样的硬件设备可以直接访问进程内存,而不用花费复制带来的额外开销。它还不违反现代操作系统提供的内存保护功能。 一类会从HMM中获益最多的应用是基于GPU的机器学习。像OpenCL和CUDA这样的库能够从HMM中获得速度的提升。HMM实现这个的方式和加速基于GPU的机器学习相似,就是让数据留在原地,靠近GPU的地方,在那里直接操作数据,尽可能少地移动数据。 像这样的加速对于CUDA(英伟达基于GPU的处理库)来说,只会有益于在英伟达GPU上的操作,这些GPU也是目前加速数据处理的主要硬件。但是,OpenCL设计用来编写可以针对多种硬件的代码——CPU、GPU、FPGA等等——随着这些硬件的成熟,HMM能够提供更加广泛的益处。 要让Linux中的HMM处于可用状态还有一些阻碍。第一个是内核支持,在很长一段时间里都受到限制。早在2014年,HMM最初作为Linux内核补丁集提出,红帽和英伟达都是关键开发者。需要做的工作不少,但是开发者认为代码可以提交上去,也许接下来的几个内核版本就能把它包含进去。 第二个阻碍是显卡驱动支持,英伟达一直在自己单独做一些工作。据Glisse的说法,AMD的GPU可能也会支持HMM,所以这种特殊优化不会仅限于英伟达的GPU。AMD一直都在尝试提升它的GPU市场占有率,有可能会将GPU和CPU整合到同一模具。但是,软件生态系统依然更青睐英伟达;要使其兑现,还需要更多的像HMM这样的中立项目,以及让OpenCL提供和CUDA相当的性能。 第三个阻碍是硬件支持,因为HMM的工作需要一项称作可重现页面故障的硬件特性。只有英伟达的帕斯卡系列高端GPU才支持这项特性。从某些意义上来说这是个好消息,因为这意味着英伟达只需要提供单一硬件的驱动支持就能让HMM正常使用,工作量就少了。 一旦HMM到位,对于提供GPU实例的公有云提供商就会面临压力,他们需要支持最新最好一代的GPU。这并不是仅仅将老款的开普勒架构显卡换成最新的帕斯卡架构显卡就行了,因为后续的每一代显卡都会更加优秀,像HMM这样的支持优化将提供战略优势。 |
|
|
|
只有小组成员才能发言,加入小组>>
1832个成员聚集在这个小组
加入小组我的项目我做主,使用GN+Ninja来完成构建系统(VSCode开发RT106X)
36063 浏览 0 评论
NXP IMX8应用处理器快速入门必备:技巧、使用、设计指南
4193 浏览 0 评论
5786 浏览 1 评论
6569 浏览 0 评论
NXP i.MX6UL开发板(linux系统烧录+规格+硬件+模块移植)使用手册
4018 浏览 0 评论
460浏览 2评论
求助,S32G上Core M启动后如何让Core A在Flash指定位置加载uboot?
429浏览 2评论
ESP32-WROVER-IE + LAN8720以太网,GPIO0电压只有1.6v,无法正常进入spi flash boot模式如何解决?
434浏览 2评论
求分享适用于PN7160 Android的NFC工厂测试应用程序
522浏览 2评论
560浏览 2评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-8-20 21:40 , Processed in 0.989845 second(s), Total 80, Slave 64 queries .
Powered by 电子发烧友网
© 2015 www.ws-dc.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号