生成式人工智能(AIGC)迅猛发展,引爆新一轮人工智能大模型产业化热潮,形成全新产业风口。上海积极布局大模型产业,全国首个大模型创新生态社区“模速空间”2023年9月在上海徐汇区揭牌后,已汇聚千余家人工智能企业、255家大模型企业以及100余家投资机构。
2025上海两会即将召开,上海市政协委员、上海社会科学院经济研究所所长沈开艳拟提交《推动大模型产业高质量发展 激发上海经济增长新动能的建议》。提案认为,大模型产业是上海发展新质生产力、加快塑造经济发展新动能的有力抓手,但面临着自主研发成本高、高质量语料获取难、技术商业化进程慢等瓶颈,亟待有效举措予以破解。
在前期调研中,沈开艳发现,大模型企业自主研发成本高,高性能计算设备成本占据研发成本大头,企业只能靠创新算法架构等策略提升训练效率和降低训练成本。解决这些瓶颈,直接融资至关重要,但上海大模型企业获取直接融资量级偏低。
她注意到,高质量语料获取渠道受限是制约大模型训练实效的重要瓶颈。尽管上海已有语料公司落地运营,且提供的语料质量较高,但其数量偏少且价格偏贵。因此,很多大模型企业偏向于从网络公开语料或者公开数据中获取语料用于大模型训练,导致数据质量无法保证,数据格式不统一,降低大模型训练实效。
沈开艳还指出,上海目前真正落地并实现商业化运营的大模型应用场景稀少。由于大模型企业内通晓大模型技术与应用的复合型人才匮乏,企业对可能催生的用户需求不明确,影响技术商业化进展和潜在场景的挖掘落地。此外,大模型技术商业化进程慢,还与解决技术、数据安全、隐私保护、过程可解释性等相关法律制度滞后相关。
针对上述问题,提案提出了三方面建议:
首先,打造全链条股权投资体系,搭建公共技术服务平台。
一是发挥政府投资基金引导作用,围绕大模型领域新设和引入产业基金,引导社会资本加大大模型领域成果转化和产业化投资力度,建立从天使投资、风险投资到股权投资的全链条股权投资体系,为产业发展提供稳定持续资本供给。二是搭建公共技术服务平台,提供企业共享使用的CPU、GPU、TPU、FPGA等高性能计算设备,降低大模型企业设备购置成本。
其次,强化数据流通与跨区域合作,破解语料供给瓶颈。
一是提升数据流通能力。联合重点央企、市属国企、数商企业等搭建数据开放平台,推动高质量数据的汇集、访问、共享、处理;鼓励上海市数据机构开放脱敏高质量数据,建设运营数据训练基地;支持上海市大模型企业建设大模型训练数据安全屋、预训练语料库。二是发挥长三角一体化优势,强化区域协作破解语料和算力难题。建议将语料和算力跨区域协同纳入长三角一体化年度议题,充分发挥长三角地区各省市在数据资源和算力资源上的互补优势,建立算力跨区域调配与成本收益划分机制,破解大模型产业发展瓶颈。
此外,开展大模型科技与场景创新,打造标志性应用场景。
一是设立上海AIGC重大科技专项。围绕通用模型理论、领域大模型、大模型应用等技术,开展领域大模型和应用场景技术的攻关,以解决当前大模型技术在垂直领域应用关键问题。
二是基于“小切口、深应用”打造一批标志性应用场景。由市经信委牵头,重点面向三大领域开展大模型应用场景创新。面向制造业:聚焦新材料、电动汽车等行业,围绕智能研发设计、未来工厂、工业互联网、自动驾驶等场景开展示范应用;面向社会民生:选择“一老一小”、未来社区、职业教育、智慧医疗等场景开展示范应用,创建智慧课堂推动普惠教育,打造虚拟心理医生强化社会心理疗愈支持等;面向社会治理:聚焦智慧城市、智慧旅游、乡村振兴、生态治理等场景,协同利用数字孪生、元宇宙技术等,开展场景创新。
还没有评论,来说两句吧...