作者:赵新华、王哲峰、单文钰、米华林
一、引言
随着ChatGPT走红,AI大模型的热度与日俱增。不到一年的时间,国内已经进入了“百模大战”,10亿参数规模以上的大模型就已经近百,20%左右是通用大模型,80%左右是垂直领域大模型[1]。各行各业都在思考和讨论如何借由AI大模型加速行业发展,为企业赋能。以北京为例,年北京首批发布的行业大模型典型应用案例覆盖了医疗、电力、消费、金融、建筑、交通、汽车等多个行业[2]。
汽车行业作为科技创新的主力军之一,同时叠加汽车电动化与智能化两大趋势,AI大模型“上车”成为众多车企的必选项。AI大模型正在悄然改变汽车行业。本文拟通过梳理AI大模型在汽车行业的应用场景,分析AI大模型“上车”的重点法律问题并提供相关风险防范建议。
二、AI大模型的概念和常见类别
1.基本概念
AI算法是一组通过计算机代码形式体现的计算规则,用于处理和分析数据。基于已有数据集运行AI算法后所得到的模型数据集与AI算法共同构成了AI模型,AI模型可作为未来推理预测的基础和处理相关数据的参照。
AI大模型通常是基于海量规模数据集运行相关算法完成预训练后的产物。以GPT大模型为例,从GPT-1到GPT-3,模型的参数量从1.17亿个增长到了亿个,最新发布的GPT-4据悉已达到了万亿级别的参数量[3]。
2.常见类别
(1)自然语言处理类大模型
自然语言处理(NaturalLanguageProcessing,缩写为NLP)是一种使计算机能够认知、理解、生成人类语言的技术。常见的自然语言处理类大模型包括大语言模型(LargeLanguageModel,缩写为LLM),即包含数十亿以上参数的旨在理解和生成人类语言的大型语言模型。
ChatGPT是基于大语言模型的典型产品,一方面ChatGPT能够认知、理解人类提出的问题和要求,另一方面ChatGPT能在一定程度上帮助人类完成回答问题、规划行程、购买产品、预约服务、创作、摘要、编程等工作。
(2)计算机视觉类大模型
计算机视觉(ComputerVision,缩写为CV)是计算机和系统从图像、视频和其他视觉输入中获取有意义的信息,并根据该等信息采取行动或提供建议的技术。
MetaAI于年4月在