轻巧的型号正在出现,中小型企业也可以采用“

随着人工智能的快速发展和重复,一些公司开始押注小型模型。与大型型号,低成本,在线快速且易于调试的中小型企业和个人用户具有更高有效性的人工智能之门的关键。 在过去的两年中,人工智能发展迅速且迭代,大雨后出现了大型语言模型。生成的人工智能,例如文本,文学和传记图像,语音处理,代码处理和视频处理,进入了人们的生活。同时,一些公司开始专注于开发可以在计算机和手机上培训的轻型小型型号。 “我们需要大量的运输,例如高速轨,飞机,游轮以及私人汽车,公共汽车以及小型运输工具,例如摩托车和自行车。由于不同的情况,一群人有不同的需求。 “桑Yanqun(Sun Yanqun),Qingdao Natural Spinics Company的联合创始人兼首席建筑师,满足特定市场的需求是增加专业和复杂的小型模型及其价值的重要原因。 今年3月,由自然语义开发的Euler模型是由生成人工智能服务网络空间的管理提出的。与可用于测量1000亿的大型模型不同,Euler参数的体积仅为25B(25亿),这是一个通常轻巧的小型模型。与YouDelo的大型大型相比,小型模型的特征是什么?该申请的前景是什么?记者采访了它。 廉价成本,易于挑选的端侧小型型号出现 目前,小型模型没有明确的含义。 Sun Yanqun表示,在该行业中,参数少于100B的模型被认为是相对较小的模型。在实际应用,如果您想在笔记本电脑上进行微调,则型号通常约为3B。 与大型模型相比,小型模型对计算强度消耗和使用成本的好处更大。具体而言,首先,培训和推理所需的硬件资源较低,使成本降低;其次,使用更方便,可以在实时计算方案中运行,例如手机,计算机,物联网设备;第三,结构很简单,开发人员可以快速寻找问题,并且易于做。 记者发现,尽管大型模型的竞争变得更加激烈,但一些公司开始押注小型模型。 2024年8月,微软和NVIDIA仅发布了小型语言模型。许多国内公司已经开始开发末端的小型模型,这些模型允许各种智能终端在“连通性和弱网络”环境中具有独立的心理能力。例如,在安努(Annu)期间北京面向墙壁的智能公司于今年3月举行的中冈论坛的Al会议发布了一名纯粹的超级智能助手,应用于智能汽车驾驶舱。今年1月,广东的Foshan Mobile领导了Foshan AI小型模型行业财团的共同建立,其重点是通过小型人工智能模型提供个人服务,以帮助企业完全智能升级。 “小型模型使我们与巨型技术实现不当竞争。”说到小型模型应用程序的具体情况,Sun Yanqun树立了一个榜样,并说欧拉通过了文件后,它开始为中小型企业和个人用户提供服务。例如,它与山东的市政档案馆合作,推出了档案模型。它已经与在青岛的一家当地仪器设备公司合作开发了与Intranet技术相关的模型。 “主动行动n“第二好之后 “客观地说,大型模型的能力比小型模型更强。在任何情况下,参数量为2.5B的模型都不能超过200B模型的计算强度。” Sun Yanqun明确指出,这也是大型公司制造所有公路模型的原因,即20万亿美元。如果模型很小,则神经网络的参数将较小,并且可以容纳的知识量还不够。 “在文本的一代中可以看出,这很容易受到上下文的影响。” 自然语义的最初目的不是小型模型。到2019年底,该公司考虑建立一个大型型号,但是由于开发的方向不清楚,资本压力和供应租金购买高计算机GPU时,它未能实施它。 “我没想到只有两年后,外国大型模型就被释放了。” Sun Yanqun回忆说,最终,随着越来越大的公司倒入大型公司E轨道的模型,随着主要硬件的增加,高计算功率GPU的价格增加。 “当时,我们听说有GPU的地方,我们刚上飞机购买它。通常,如果我们提前支付押金,我们就不必购买它。”最终,该公司使用10个以上的设备来生产计算电动群集,该群集可以支持7B参数的模型。 为了根据现有设备尽可能地改善参数,自然语义公司的工程师以新的方式参与单词并将计算在集思广益后将矢量从真实空间转换为复杂空间。 “在模型中进行了训练之后,这些技术取得了相对较好的结果,这可以使3B参数模型达到约60%的150B参数模型。”孙扬昆说。 中国信息与传播学院人工智能学会副首席工程师王扬田告诉记者n个小型模型在“减少”之后可以保持出色的性能,这是由于该模型的一系列成熟压缩和出色的建筑技术,包括修剪,定量 - 迪斯蒂尔以及设计自然,有效的网络架构。 让“小人物”制成“大能量” “小型模型有很大的潜力。”在Wang Yuntao的观点中,将进一步发布小型模型在特定的未来应用情况下的潜力。 AI终端代表的产品的申请表和服务将是小型型号发布其出色功能的主要战场。 关于小型模型的申请前景,王扬田解释说,首先为离线办公室,文件摘要,私人对话和其他情况奠定了基础。其次,与处理器架构应用程序和神经处理单元技术一起,手机,车内和物联网设备将是自然的阶段小型型号;第三,具有6B和以下参数的模型出现在领域中,以及“专家和创新”行业,例如财务,医疗保健,法律,教育等,以低成本和快速的在线在线,并且可以超过特定任务中的整体大型模型。 “关心市场是否解决了实际问题。这与背后的模型的细节无关。要深入现场,重要的是要获得行业知识,尤其是一个奇妙的小型模型,这一点很重要。”王扬塔说。 从用户的角度到实际应用程序,小型模型的有效性的好处也很明显。 Zhang先生是北京一家Internet公司的算法工程师,他告诉记者,借助Code的现有技术,很难在当地部署大型模型。 “专业的GPU芯片太昂贵了,无法应用于低价终端。例如,配备手机和机器人的芯片无法支持大型型号。此外,配备这些终端的电池通常不支持高性能芯片的电力消耗。张先生说,这些硬件性能有限的终端更适合使用小型型号。 Wang Yuntao坚持认为未来将是混合大型和小型模型的系统范式。 “基于云的大型模型负责一般推理,而端端小型模型对私人域数据的立即响应和处理。”他还强调,小型模型不是“大型模型的低适合版本”,而是针对资源庞大的环境和专用活动的成本效益的解决方案。在与混合端云扩展和行业数据调整的合作的案例中,企业可以完全启用“小数字”来产生“大能量”,并为实施AI业务的下一个过程带来一些好处。 (负责编辑:朱赫) 神性:中国网财务已印刷本文以提供其他信息,并不代表本网站的观点和位置。本文的内容仅供参考,并且不会产生投资建议。投资者在此基础上以自己的风险行事。

Related Posts

Comments are closed.