新闻资讯

只需将一系列贴有标签的照片输入网络

来源：津信变频器发布于：2019-4-21 9:10:32 点击量：

2019/04/22 08/23/54　　【丹佛斯变频器 www.dfsbp.com】如图一所示，一个脉动阵列可以同时计算多达　２５６　个　ＭＡＣ，然后数据立即流到下一行进行下一个计算。这个过程我们称之为训练　（ＴＲＡＩＮＩＮＧ）。自动驾驶汽车使用人工智能进行图像识别和路径规划。一旦指定，网络就可以通过应用程序编程接口　（ＡＰＰＬＩＣＡＴＩＯＮ　ＰＲＯＧＲＡＭＭＩＮＧ　ＩＮＴＥＲＦＡＣＥ，ＡＰＩ）　和一组驱动程序在任何硬件上运行。如同前面提过的，ＤＮＮＳ　的推理　（ＩＮＦＥＲＥＮＣＥ）　并不需要高精度浮点运算，因此使用　ＧＰＵ　反而会造成功耗的浪费。例如，当你使用语音助理，如　ＡＭＡＺＯＮ　的　ＡＬＥＸＡ　或是　ＡＰＰＬＥ　的　ＳＩＲＩ，你的请求会被传输到云端　（ＣＬＯＵＤ），在那里，服务器会解析你的语音，然后生成正确的响应或回答，并将其发送回你的设备。例如该公司的　ＥＹＥＱ４　处理器每秒可产生　２　万亿次整数运算，而功耗仅为　３Ｗ，与高端数据中心处理器相比这数值低多了。通过这种方式，ＤＮＮ　开发人员无需对底层硬件进行编程。这些　５１２　位可以通过多种方式分配，例如，１６个单精度浮点值　（ＳＩＮＧＬＥ　－　ＰＲＥＣＩＳＩＯＮ　ＦＬＯＡＴＩＮＧ　ＰＯＩＮＴ　ＶＡＬＵＥ，亦即　１６个　３２　位浮点）　或　６４　个　８　位整数　（ＩＮＴＥＧＥＲＳ）。

　　现场可编程门阵列　（ＦＰＧＡＳ）

　　定制架构　（ＣＵＳＴＯＭ　ＡＲＣＨＩＴＥＣＴＵＲＥ）　芯片在人工智能加速器具有巨大前景，例如专用集成电路　（ＡＳＩＣ）　因为是针对特定算法及应用优化所设计，因此其效能、面积　（成本）、设计保密度等各方面都具有优势。它并具有　６　个　ＤＤＲ４　ＤＲＡＭ　通道，用以满足网络其余部分的高速存储需求。

　　为了解决这个问题，人工智能研究人员创建了用于开发　ＤＮＮ　的工具。再者，研究人员仍在继续开发新的　ＤＮＮ　算法、新的激活函数　（ＡＣＴＩＶＡＴＩＯＮ　ＦＵＮＣＴＩＯＮ）　和新的数据格式，如果设计者猜错或者没有预测到新的算法，他们的产品可能会在市场上失败。数据中心、自动驾驶和消费性／物联网应用程序需要不同的解决方案。精确解析车辆周围的环境这最困难的问题解决之后，其他复杂的算法则用以确定通往目的地的最佳路径，同时确保安全。例如，ＩＮＴＥＬ　的　ＳＴＲＡＴＩＸ　１０　ＦＰＧＡ　拥有多达　５，７６０　个　ＤＳＰ　模块，每秒可产生　２３　万亿次整数运算　（ＳＴＲＡＴＩＸ　１０　使用比　８　位整数更精确的　１８　位整数）。通用处理器　（ＧＥＮＥＲＡＬ－ＰＵＲＰＯＳＥ　ＰＲＯＣＥＳＳＯＲＳ）　最容易编程的，而图形处理器　（ＧＲＡＰＨＩＣＳ　ＰＲＯＣＥＳＳＯＲＳ，ＧＰＵＳ）　则为大多数工作提供了较好的性能。这种灵活性非常重要，因为　ＤＮＮＳ　的训练通常需要　３２　位浮点　（ＦＰ３２），而推理可以使用较小的　８　位整数　（ＩＮＴ８）　来提高吞吐量　（ＴＨＲＯＵＧＨＰＵＴ）　和功率效率。ＩＮＴＥＬ　希望　ＮＥＲＶＡＮＡ　设计能够支持数据中心的培训和推理。由美国国防部先进计划署　（ＤＡＲＰＡ）　推动的电子产业振兴计划　（ＥＬＥＣＴＲＯＮＩＣＳ　ＲＥＳＵＲＧＥＮＣＥ　ＩＮＩＴＩＡＴＩＶＥ，ＥＲＩ），其中一个计划就是软件定义硬件。到　２０２０　年，我们预计大规模生产所谓的　ＳＡＥ　等级　４　的自动驾驶汽车，在有限的地理区域　（如城市）　和良好的天气条件下，这些汽车是不需要人类驾驶的。

　　数据中心加速器　（ＤＡＴＡ　－　ＣＥＮＴＥＲ　ＡＣＣＥＬＥＲＡＴＯＲＳ）

　　虽然　ＧＰＵ　为　ＤＮＮ　提供了一个有效的解决方案，特别是在需要浮点运算时，但是　ＧＰＵ　最初是为图形设计的，而不是为人工智能设计的。（ＰＨＯＴＯ　ＳＯＵＲＣＥ　：　ＤＡＲＰＡ）

　　自动驾驶　（ＡＵＴＯＮＯＭＯＵＳ　ＤＲＩＶＩＮＧ）

　　每家大型汽车制造商都在开发自动驾驶技术，最终将允许乘客在无人驾驶的情况下安全地搭乘汽车。这种定制芯片每单位瓦可以提供最佳性能，尽管结果因实施情况会有所不同。自动驾驶汽车必须分析来自摄像机和其他传感器的实时数据，识别地标　（如车道标志、路标、建筑物）　以及潜在的危险　（如车辆、行人、道路碎片）。

　　没有一种处理器能够同时满足这些具有不同性能、功率和成本要求的广泛应用，每ㄧ种处理器也各自有其强项及弱点。此芯片及其高带宽内存　（ＨＩＧＨ　ＢＡＮＤＷＩＤＴＨ　ＭＥＭＯＲＹ，ＨＢＭ）　的总功率为　２５０Ｗ　ＴＤＰ。医疗、金融投资、石油勘探、制造业和零售业等各行各业也都发现人工智能可以改进工作流程和效率。ＳＤＨ　可以：

　　ㄧ、　当输入数据发生变化时，动态优化代码和硬件，

　　二、　重用硬件来處理新的问题和新的算法，以解决现有问题。

　　。要有效地实现这些人工智能任务，需要为汽车、无人机、安全摄像头、家用电器、可穿戴设备、医疗设备和其他物联网系统开发新型处理器。现在人工智能处理的需求非常大，许多公司正在开发定制芯片，优化　ＤＮＮＳ　加速。研究显示，对于推理来说，ＦＰ３２　和　ＩＮＴ８　在　ＤＮＮ　精度上的差异是很小的。

　　２０１６年，ＩＮＴＥＬ　收购了ＮＥＲＶＡＮＡ　ＳＹＳＴＥＭＳ，这是一家开发为　ＤＮＮ　优化的新架构的初创公司。ＸＩＬＩＮＸ　与　ＩＮＴＥＬ　是　ＦＰＧＡ　人工智能加速器的领导者。在这种架构中，当激活数据流过时，权重　（ＷＥＩＧＨＴ）　沿着阵列向下流动，从而使每个周期能够进行大量的乘积累加运算　（ＭＡＣ）。开发者必须根据他们的应用选择适当的处理器，才能在这极具竞争的市场中脱颖而出。ＳＤＨ　可以实现接近　ＡＳＩＣ　的性能，但不会牺牲数据密集型算法的可编程性。ＳＤＨ　的目标是构建运行时可重新配置的软硬件，也让芯片可以根据软件对其硬件进行调整。顾名思义，深度神经网络　（ＤＮＮＳ）　比之前的简单网络复杂，因此研究人员求助于功能最强大的服务器来运行这些新网络，例如　ＩＮＴＥＬ　的　ＸＥＯＮ　就是其中ㄧ个颇受欢迎的处理器。因此，数据中心、自动驾驶汽车以及各种消费性和物联网系统都需要不同类型的人工智能芯片。ＧＯＯＧＬＥ　的　ＥＤＧＥ　ＴＰＵ　（ＴＥＮＳＯＲ　ＰＲＯＣＥＳＳＩＮＧ　ＵＮＩＴ，张量处理器）　就是为边缘计算应用所开发的处理器。

　　２０１７　年，ＩＮＴＥＬ　收购了　ＭＯＢＩＬＥＹＥ，这是等级　２　和等级　３　高级辅助驾驶系统　（ＡＤＶＡＮＣＥＤ　ＤＲＩＶＥＲ　ＡＳＳＩＳＴＡＮＣＥ　ＳＹＳＴＥＭＳ，ＡＤＡＳ）　处理器的领先供应商。这些　“框架　（ＦＲＡＭＥＷＯＲＫＳ）”　为构建网络、指定节点和连接的数量提供一个高级接口　（ＨＩＧＨ　－　ＬＥＶＥＬ　ＩＮＴＥＲＦＡＣＥ）。针对特定工作优化的定制　ＡＩ　架构可以使用现场可编程门阵列　（ＦＩＥＬＤ　ＰＲＯＧＲＡＭＭＡＢＬＥ　ＧＡＴＥ　ＡＲＲＡＹ，ＦＰＧＡＳ）　或是专用集成电路　（ＡＰＰＬＩＣＡＴＩＯＮ　ＳＰＥＣＩＦＩＣ　ＩＮＴＥＧＲＡＴＥＤ　ＣＩＲＣＵＩＴ，ＡＳＩＣ）　来展开。

　　为了实现这些目标，ＳＤＨ　需要非常快的硬件重新配置速度和动态编译能力才能达成这些目标。它有　１２　个定制的　ＳＨＡＶＥ　内核，每个周期可以处理　１２８　位，以及一个新的神经计算引擎，可提供大部分的　ＤＮＮ　加速。此示例来自　ＧＯＯＧＬＥ　的　ＴＰＵ。

　　由于这些问题和其他原因　（如安全、隐私），人工智能处理开始出现在边缘　（ＥＤＧＥ）　和客户端设备中，如智能手机、家庭网关　（ＧＡＴＥＷＡＹ）、物联网　（ＩＯＴ）　和自动驾驶汽车等等。但问题是，实现定制架构，从芯片设计、掩膜　（ＭＡＳＫ）　制作、晶圆厂投片制造、测试验证到量产，可能需要花上ㄧ年以上的时间，而且一旦设计确认，芯片制造出来，硬件就无法更改。消费者不希望整个行李箱填满驱动系统，汽车制造商将功率消耗限制在　４０Ｗ　左右，以避免降低发动机性能和行驶里程。Ｖ１００　只有　６ＭＢ　的高速缓存，此小容量内存会影响大型网络的性能，尽管芯片使用　ＨＢＭ　来部分弥补这一缺点。

　　图形处理器　（ＧＲＡＰＨＩＣＳ　ＰＲＯＣＥＳＳＯＲＳ）

　　为了创建高质量的图像，现代图形处理器　（ＧＰＵ）　仰赖称为着色器内核　（ＳＨＡＤＥＲ　ＣＯＲＥＳ）　的可编程引擎，这是具有强大的浮点运算能力的引擎。ＤＮＮＳ　和传统软件的结合可以处理路径规划。数据中心人员可以使用这些灵活的处理器运行标准程序或是　ＤＮＮ，以跟上需求的变化。２０１９　年ㄧ月　ＩＮＴＥＬ　推出了该公司为推理所研发的　ＮＥＲＶＡＮＡ　神经网络推理处理器　（ＮＮＰ－Ｉ），该处理器将在　２０１９　年下半年出货而用于训练的处理器将在年底推出。

　　图一：　脉动　ＭＡＣ　阵列　（ＳＹＳＴＯＬＩＣ　ＭＡＣ　ＡＲＲＡＹ）。该设计使用片上　ＨＢＭ　实现大容量存储器带宽。这种方法是该公司原始　ＡＶＸ　设计的扩展，使每个　ＣＰＵ　能够一次处理　５１２　位的数据，是标准　ＣＰＵ　的　８　倍。

　　大多数人工智能处理发生在数据中心。因此现代　ＦＰＧＡ　已崁入很多常用的计算单元甚至是　ＩＰ，比如加法器、乘法器、片上　ＲＡＭ，甚至嵌入式ＣＰＵ，这些单元不是通过传统　ＦＰＧＡ　编程方式来构建，而是跟　ＡＳＩＣ　一样，用晶体管搭成，这可有效节省芯片面积，同时提升性能，这些计算单元同样的可以让用户配置和组合。因此，从　ＦＰ３２　转移到　ＩＮＴ８　可以减少多达　８Ｘ　的计算面积。

　　ＮＶＩＤＩＡ　是人工智能应用　ＧＰＵ　芯片的领先供应商。例如，该公司为数据中心所开发的的高端　ＧＰＵ　ＴＥＳＬＡ　Ｖ１００　（“ＶＯＬＴＡ”），它拥有　３２０　个着色器内核　（称为　ＷＡＲＰ　内核），每秒可以处理　１４　万亿　ＦＰ３２　操作。

　　要达成这个目标需要复杂的人工智能算法和处理器。

　　消费性应用的处理器必须以尽可能低的成本交付所需的　ＡＩ　性能。例如，ＩＮＴＥＬ　提供了提供由其　ＭＯＶＩＤＩＵＳ子公司开发的视觉处理芯片　ＭＹＲＩＡＤ　２。

　　ＳＤＨ　将创建可塑的硬件／软件体系结构，与　ＡＳＩＣ　不同，它允许应用程序将硬件配置延迟到运行时才进行。这些定制化演示了将　ＦＰＧＡＳ　用于　ＤＮＮＳ　的优势。

　　此外，ＧＰＵ　虽然擅长浮点运算，有着极高的运算效能，这优势却也成为它在某些　ＡＩ　应用上的绊脚石。目前，ＴＥＮＳＯＲＦＬＯＷ、ＣＡＦＦＥ／　ＣＡＦＦＥ２　和　ＴＯＲＣＨ／ＰＹＴＯＲＣＨ　是最受欢迎的　ＤＮＮ　框架。此外，８　位　ＭＡＣ　使用的面积是　３２　位　ＭＡＣ　的四分之一。渐渐的，研究人员发现图形芯片　（ＧＰＵ）　可以提供更好的性能和电力效率。（注：　本文发稿时，有　１６　个　ＳＨＡＶＥ　内核的　ＭＹＲＩＡＤ　Ｘ　也已问世）

　　图三：　ＩＮＴＥＬ　（ＭＯＶＩＤＩＵＳ）　搭载　ＭＹＲＩＡＤ　２　的视觉处理芯片提供类似　Ｕ　盘的包装。这些处理器通常是为推理进行优化的，而且还必须满足其目标市场的性能、功耗、成本和集成需求。

　　图二：　ＳＤＨ　的概念和结构　。预期　ＳＤＨ　系统的效率将是　ＡＳＩＣ　的　５　倍、ＣＰＵ　的　５００－１０００　倍。（ＰＨＯＴＯ　ＳＯＵＲＣＥ　：　ＴＨＥ　ＬＩＮＬＥＹ　ＧＲＯＵＰ）

　　另一个共同的特征是脉动　ＭＡＣ　阵列　（ＳＹＳＴＯＬＩＣ　ＭＡＣ　ＡＲＲＡＹ）。能够识别少量基本语音命令的神经网络所需要的存储器和处理能力相对较少。然而，一些共同的特征开始显现。

　　尽管它们具有庞大车身的和强大的引擎，但汽车功率和尺寸的限制比数据中心更多。

　　人工智能处理最初是在通用处理器　（ＧＥＮＥＲＡＬ－ＰＵＲＰＯＳＥ　ＰＲＯＣＥＳＳＯＲＳ）　上开发的，因为通用处理器非常普遍而且容易编程。它为所有受欢迎的框架以及其他工具提供驱动程序，以促进　ＤＮＮＳ　的开发和训练。相比之下，ＣＰＵ　或　ＧＰＵ　内核对指令进行解码，从寄存器　（ＲＥＧＩＳＴＥＲ）　加载　５１２　位数据，最多计算　１６　个　ＭＡＣ，然后将结果存储到寄存器中。高端　８１８０　型号在　３．２ＧＨＺ　的峰值速度下，每秒可以产生超过　２　万亿　（ＴＲＩＬＬＩＯＮ）　次　ＦＰ３２　操作，或是，　８　万亿次　ＩＮＴ８　操作，所消耗功率为　２０５Ｗ　ＴＤＰ　（ＴＨＥＲＭＡＬ　ＤＥＳＩＧＮ　ＰＯＷＥＲ，热设计功耗）。现在研究人员不再需要手工构建一个软件程序来识别照片中的人脸，只需将一系列贴有标签的照片输入网络，网络就会自动配置来识别人脸。为了充分实例化这些功能，ＡＩ　处理不能被困在云中，相反的，它正向终端用户　（边缘）　靠近。ＭＯＢＩＬＥＹＥ　专注于视觉处理，即分析相机图像和识别物体的能力。数据中心将继续发挥重要作用，特别是在训练　ＤＮＮＳ　方面，因此云服务提供商也在为他们的人工智能需求寻找更好的处理器。无人机可以使用类似的处理器来分析周围环境、避开障碍物、或在滑雪场或滑板公园跟踪拍摄对象。其台达变频器他专门为神经网络设计的硬件架构也陆续问世。ＦＰＧＡ　还可以配置为每秒产生　９　万亿次　ＦＰ３２　运算。这项技术也可以应用于卡车、飞机和无人机。但是，数据往返云端会产生延迟，影响响应速度，如果没有网络连接或连接因故中断，整个过程就会失败。在处理这些　ＤＮＮ　计算时，ＩＮＴＥＬ　ＦＰＧＡ　的功率消耗　（包括内存）　为　１２５Ｗ。该公司还提供许多其他型号，以降低价格和功率水平。

　　ＩＮＴＥＬ　基于　ＳＫＹＬＡＫＥ－ＳＰ　设计的　ＸＥＯＮ　ＳＣＡＬＡＢＬＥ　处理器，可实现多达　２８　个具有　ＡＶＸ－５１２　功能的　ＣＰＵ　内核。一个整数　ＭＡＣ　（ＭＵＬＴＩＰＬＹ　ＡＣＣＵＭＵＬＡＴＥ，乘积累加运算）　单元的晶粒面积　（ＤＩＥ　ＡＲＥＡ）　大约只有浮点单元的一半而已。

　　微软创建了一个名为　ＢＲＡＩＮＷＡＶＥ　的架构，并将其在　ＩＮＴＥＬ　ＳＴＲＡＴＩＸ　ＦＰＧＡＳ　中实例化，从而加速数据中心的推理速度。

　　ＩＮＴＥＬ　预见到　ＤＮＮ　将会伟肯变频器大量普及，因此开发一款名为　ＡＶＸ－５１２　的技术来因应这方面的需求。使用这种迭代方法，它开发并测试了一个定制的　９　位浮点格式　（ＦＰ９），然后确定采用一个比标准　ＩＮＴ８　性能高一倍的　８　位格式　（ＦＰ８）。

　　尽管研究人员在人工智能方面已经努力了几十年，但在过去　５　年，人工智能才取得巨大的进展，部分原因是深度神经网络　（ＤＥＥＰ　ＮＥＵＲＡＬ　ＮＥＴＷＯＲＫＳ，ＤＮＮ）　的出现。该芯片的运算速度为每秒　１　万亿次，但它的功耗在一般情况只有约　１Ｗ　左右。网络经过训练之后，它就可以处理新的照片来识别人脸，这种部署模式称为推理　（ＩＮＦＥＲＥＮＣＥ）。最后，人工智能处理器通常包括特殊的硬件来计算常用的　ＤＮＮ　函数，如激活　（ＡＣＴＩＶＡＴＩＯＮＳ）、归一化　（ＮＯＲＭＡＬＩＺＡＴＩＯＮ）　和池化　（ＰＯＯＬＩＮＧ），这些函数在标准　ＣＰＵ　或　ＧＰＵ　上通常需要执行多个指令。ＩＮＴＥＬ　计划将其中两种处理器与负责处理路径规划的低功耗　ＸＥＯＮ　芯片相结合，这种组合可以满足一辆汽车的　４０Ｗ　功率预算。因此，一些　“智能相机”　集成了一个处理器，该处理器可以分析图像并只有在出现异常时才将图像发送到云端。人工智能　（ＡＩ）　正被广泛运用于各式各样的应用上，但也因为应用的多样化，因此目前没有一种处理器能够支持所有的人工智能解决方案。新的人工智能芯片技术，如软件定义硬件　（ＳＯＦＴＷＡＲＥ　ＤＥＦＩＮＥＤ　ＨＡＲＤＷＡＲＥ，ＳＤＨ），也正研发中。此外，如果公司想要修复一个错误，或是对架构做一个微小改进，它可以在几分钟内更新相同的　ＦＰＧＡ　芯片，而不需要购买新的芯片。脉动阵列消除了这些额外的指令解码和寄存器存取动作，简化了芯片设计。即使微控制器有足够的性能来处理基本的语音识别，人工智能芯片也可以用一小部分的功率来完成相同的功能。ＤＮＮＳ　在这种图像识别方面表现出色。

　　通用处理器　（ＧＥＮＥＲＡＬ－ＰＵＲＰＯＳＥ　ＰＲＯＣＥＳＳＯＲＳ）

　　通用处理器为个人电脑　（ＰＣＳ）、服务器　（ＳＥＲＶＥＲＳ）　和超级计算机　（ＳＵＰＥＲＣＯＭＰＵＴＥＲＳ）　丹佛斯提供运算能力，运行各种各样的软件程序。

　　由于这些人工智能加速器的开发还处于起步阶段，因此研究人员正在应用许多不同的架构来解决这个问题。这种节能在智能手表和其他电池驱动设备中至关重要。

　　软件定义硬件　（ＳＤＨ）

　　基于上述　ＦＰＧＡ　崁入常用计算单元的同样概念，一种新型的芯片技术　—　软件定义硬件　（ＳＯＦＴＷＡＲＥ　ＤＥＦＩＮＥＤ　ＨＡＲＤＷＡＲＥ，ＳＤＨ）　应运而生。该公司每周都会进行ㄧ些调整，同时将其推广到数千个　ＦＰＧＡＳ。着色器内核可以对图形之外的任务进行编程，尽管它们的编程模型和软件开发工具比标准　ＣＰＵ　较难以使用。

　　虽然　ＦＰＧＡＳ　有着上述的优势，但为了达到灵活使用的目的，ＦＰＧＡＳ　实际可运用之逻辑电路只占芯片面积的　１０％～２０％　左右，其余都是用在连线电路上，这意味著芯片面积的浪费与成本的提高。公司可以将相同的架构烧录到　ＦＰＧＡ　中，几分钟内就可以启动并运行，而不是将一个新架构精雕细琢到　ＡＳＩＣ　中，然后花数个月等待芯片从晶圆厂回来。除了像　ＡＭＡＺＯＮ　ＡＬＥＸＡ　这样的语音助理现在已普遍出现在各家厂商之智能音箱外，我们开始看到支持声控的电视，烤箱，智能手表，照明什至厕所。更小的面积也同时意味着较低的功耗。

　　一种解决方案是使用　ＦＰＧＡ，这种灵活的芯片可以实时实现新的设计。研究人员正在评估其他数字格式，以优化精度和晶粒面积／功耗之间的权衡。这种在靠近数据生成位置分析处理数据的方法称为边缘计算　（ＥＤＧＥ　ＣＯＭＰＵＴＩＮＧ）。为了简化软件开发，ＭＹＲＩＡＤ　２　还提供一种做成类似　Ｕ　盘的包装让你可以直接插入连接个人电脑。目前边缘计算大多用于推理，也就是使用预先已训练好之模型对生成的海量数据进行分析与推理，并且可以判断哪些数据不需传回云数据中心，进而减少流量。

　　虽然通用处理器易于编程，然而其计算内核数最多只有几十个，并行处理能力稍嫌不足，因此运算效能不及　ＧＰＵＳ。为了满足其数据中心的需求，微软还针对　ＢＲＡＩＮＷＡＶＥ　进行低延迟优化，即使在少量请求的情况下也能保持高效率。如今，有些汽车已经具备了半自动化技术，但它们需要驾驶员的监督。

　　为了满足这些消费者的需求，一些公司开发了低功耗的人工智能处理器。由于这些内核专注于计算并省略了通用处理器架构的许多功能，因此它们的晶粒　（ＤＩＥ）　尺寸比　ＣＰＵ　小，所以ㄧ个芯片可以放入较多的　ＧＰＵＳ。（ＰＨＯＴＯ　ＳＯＵＲＣＥ　：　ＩＮＴＥＬ）

　　结论

　　自从深度神经网络　（ＤＮＮ）　出现以后，人工智能处理正在席卷科技行业，并渗透到许多其他领域，通过自动化简单的任务，改善工作流程和消费者的生活方式。许多应用还需要使用较小的芯片，以消耗尽较少的功率。例如，用于推理的产品可以不使用浮点运算　（例如　ＦＰ３２），而专注于较小的整数运算　（例如　ＩＮＴ８）。ＳＤＨ　计划旨在创建硬件／软件系统，允许数据密集型算法以接近　ＡＳＩＣ　的效率运行，但又不会面临　ＡＳＩＣ　所拥有的高制造成本、长开发时间或单一应用等等的缺点或限制。该芯片还包含超过　４５ＭＢ　（兆字节）　的高速缓存　（ＣＡＣＨＥ　ＭＥＭＯＲＹ），可存储大型　ＤＮＮ　的关键参数。

　　大多数网络安全监控摄像机都会将视频发送到云上进行处理，但这种方法会占用大量带宽，特别是对于高解析度摄像机。加速器　（ＡＣＣＥＬＥＲＡＴＯＲＳ）　是指以现有芯片架构　（如　ＣＰＵ、ＦＰＧＡ　等）　为基础，针对某特定算法或应用进行优化，进以提升在此特定应用时的运算速度。

　　基于网络的服务使用人工智能来改进语音界面　（例如　ＡＭＡＺＯＮ　的　ＡＬＥＸＡ　语音助理）、搜索结果、人脸识别、语言翻译和垃圾邮件过滤等。

　　ＦＰＧＡ　非常适合神经网络，因为它除了可配置逻辑　（ＣＯＮＦＩＧＵＲＡＢＬＥ　ＬＯＧＩＣ）　模块外，还包括许多称为　ＤＳＰ　模块的　ＭＡＣ　单元。虽然用户可以接受在做一般查询的云处理时有些延迟，但在居家处理照明调整或更改电视或广播频道的语音命令则必需获得快速响应。新的处理器必须满足这些限制，同时提供等级　４　和等级　５　自动驾驶所需的高性能。（注：　ＳＡＥ　是美国汽车工程师学会　（ＳＯＣＩＥＴＹ　ＯＦ　ＡＵＴＯＭＯＴＩＶＥ　ＥＮＧＩＮＥＥＲＳ））

　　表ㄧ：　自动驾驶汽车　ＳＡＥ　分级表。

　　消费性　（ＣＯＮＳＵＭＥＲ）　／物联网　（ＩＯＴ）　产品

　　人工智能处理适用于许多消费产品

20190422082354

上一篇：只要在汽油中加入４％　的氢气

下一篇：可仅凭这些总结依然无法得出这个东西是猫时

新闻中心

联系我们

新闻资讯

只需将一系列贴有标签的照片输入网络

相关阅读