快捷搜索:  as  2018  FtCWSyGV  С˵  test  xxx  Ψһ  w3viyKQx

和记app官网_蓝莲花网进入



企业选择差错的人工智能存储平台可能会孕育发生严重影响。是以,人们必要懂得可能影响企业选择人工智能数据存储策略的6个准则。

人工智能和机械进修如今已成为企业最紧张的两个对象,可赞助企业使用其核心数字资产创造竞争上风。然则在采纳人工智能数据存储之前,企业必须根据机械进修平台若何获取、处置惩罚和保留数据来斟酌一系列要求。

首先反省一下机械进修软件应用的数据的生命周期,由于这可以赞助企业懂得为人工智能选择存储时应斟酌的事变。最初,企业必须获取数据以练习机械进修或人工智能算法。这些是处置惩罚数据以进修义务的软件对象,例如识别工具、处置惩罚视频和跟踪运动。数据可以从各类滥觞孕育发生,并且平日在本色上长短布局化的,例如工具和文件。

练习历程将获取数据资产,并应用机械进修或人工智能软件来创建用于处置惩罚未来数据源的算法。在练习或开拓算法时,人工智能软件将处置惩罚源数据以开拓模型,该模型可以创建洞察力或满意营业需求。

开拓机械进修算法很少是一个单一的历程。跟着企业积累越来越多的数据,其算法也会获得完善和改进。这意味着很少的数据会被丢弃,而是跟着光阴的推移会增长并从新处置惩罚。

采纳人工智能数据存储的标准

在为人工智能平台选择存储之前,企业必须首先斟酌以下事变:

(1)用度。人工智能数据存储的价格是企业斟酌购买的关键身分。显然,企业治理层和介入采购决策的职员都盼望数据存储尽可能具有资源效益,并且在许多环境下,这将影响企业的产品选择和策略。

(2)可扩展性。企业必要网络、存储和处置惩罚大年夜量数据以创建机械进修或人工智能模型。机械进修算

法要求源数据呈指数增长,以实现精度的线性前进。创建靠得住而准确的机械进修模型可能必要数百TB以致PB的数据,而且这会跟着光阴的推移而增添。

构建PB级存储系统平日意味着应用工具存储或横向扩展文件系统。今世工具存储可以办理人工智能事情负载的容量需求,然则它们可能无法满意其他前提,例如高机能。横向扩展文件系统可以供和记app官网给高机能和优越的可扩展性,然则将全部数据集存储在单个平台上可能会很昂贵。因为可扩展性请乞降大年夜容量产品的资源,块存储平日不是机械进修或人工智能的精确选择。独一的例外是在公共云中。

存储资源的变更引入了分层或应用多种类型的存储来存储数据的设法主见。例如,工具存储库是存储大年夜量非活感人工智能数据的优越目标。当必要数据进行处置惩罚时,可以将其移动到高机能文件存储集群或工具存储中为高机能而设计的节点中,一旦完成处置惩罚,就可以将数据移回。

(3)机能。人工智能数据的存储机能包括三个方面。首先,可能也是最紧张的是延迟。这定义了软件发出的每个I/O哀和记app官网求的处置惩罚速率。低延迟很紧张,由于改良延迟会直接影响创建机械进修或人工智能模型所需的光阴。繁杂的模型开拓可能必要数周或数月的光阴才能运行。经由过程缩短开拓周期,企业可以更快地创建和完善模型。在反省延迟功能时,因和记app官网为工具造访的流动性子,工具将参考光阴存储到第一个字节,而不是单个I/O哀求的延迟。

机能的另一个方面是吞吐量,以及可以将数据写入存储平台或从存储平台读取数据的速率。系统吞吐量很紧张,由于人工智能培训会处置惩罚大年夜量数据集,平日会反复读取和从新读取相同的数据以准确地开拓模型。机械进修和人工智能数据的滥觞(例如自动驾驶车辆上的传感器)天天可以孕育发生数TB的新数据。所有这些信息都必须添加到现稀有据存储中,并且对任何现有处置惩罚的影响最小。

精确设置存储平台至关紧和记app官网张,由于涉及的数据量异常大年夜。

机能的着末方面是并行造访。机械进修和人工智能算法并行处置惩罚数据,运行多个义务,这些义务可以多次读取同一数据,并且可以超过许多并行义务。工具存储长于并行读取I/O处置惩罚,由于没有工具定或要治理的属性。文件办事器跟踪内存中打开的I/O哀求或文件句柄。是以,活动I/O哀求的数量取决于平台上可用的内存。

机械进修数据可以包孕大年夜量的小文件。在这方面文件办事器可以供给比工具存储更好的机能。向人工智能存储供应商提出的一个关键问题是,其产品的机能特性将若何在大年夜文件和小文件类型之间发生变更。

因为大年夜多半大年夜型工具存储太大年夜而无法按期备份,是以靠得住的擦除编码已成为人工智能存储平台的基础功能。

(5)公共云。开拓机械进修和人工智能算法必要高机能的存储和高机能的谋略。许多人工智能系统都基于GPU(例如Nvidia DGX),可以减轻开拓正确算法所涉及的许多繁杂数学谋略的包袱。

公共云办事供给商已开始供给可用于机械进修的GPU加速虚拟实例。在公共云中运行机械进修对象可低落构建用于机械进修开拓的根基举措措施的投本钱钱,同时供给扩展开拓机械进修模型所需的根基举措措施的能力。

应用公共云谋略所面临的寻衅是若何以经济高效且实用的要领将数据导入公共云。基于云谋略的工具存储速率太慢,无法满意机械进修的I/O需求;是以,必须应用本地块存储。移动数据的延迟和机械进修的延迟意味着运行根基举措措施的资源增添。

公共云的另一个问题是数据出口的资源。只管云谋略办事供给商不收取将数据移入其平台的用度,但他们对从其平台外部的公共收集造访的任何数据收取用度。其结果是,只管公共云供给了谋略的机动性,但以及时且经济高效的要领将数据收支云平台并不老是那么轻易。

云谋略供应商正在开拓可在公共云中运行其产品的存储产品,这些存储超过内部支配根基举措措施和云平台。这些产品可以有效地复制数据或将数据移至云平台中,并且仅在完成后才将结果移回。这些复制技巧具有高带宽效率,使在内部支配存储数据并导入到云平台中进行阐发事情变得切实可行。

(6)整合。在机械进修和人工智能的存储方面必要与谋略隔脱离来。和记app官网构建人工智能数据存储可能很艰苦,由于存储收集和调剂存储必须斟酌其他身分才能与机械进修利用法度榜样一路事情。

产品的预包装使云谋略供应商能够在将产品交付给客户之前对其产品进行测试和优化。如今,有一些存储产品将盛行的人工智能软件、CPU和GPU等谋略、收集和存储设备结合在一路,以供给支持人工智能的平台。在支配这些系统之前,许多具体的调剂事情已完成。只管资源可能是一个问题,但对付许多客户而言,预包装的系统可以削减采纳人工智能存储的障碍。

显然,选择相宜的人工智能数据存储平台是权衡指标,例如机能、可扩展性和资源。精确设置存储平台至关紧张,由于涉及的数据量异常大年夜。选择差错的产品可能是一个价值高昂的差错。与任何存储产品决策一样,企业与云谋略供应商交谈以准确懂得其产品若何满意人工智能和机械进修的需求也很紧张。其介入历程应包括演示和评估,以作为任何可能的购买抉择的前奏。

责任编辑:ct

您可能还会对下面的文章感兴趣: