九游娱乐“拍一张你的照片,输入到3D生成大模型里,之后手机里就能生成一个和你模样相似的‘数字人’,和你对话,在屏幕中唱歌跳舞。”近日,湖南马栏山视频先进技术研究院(以下简称“视超智算”)AIGC算法工程师黎维接受记者采访时介绍。
在号称“世界媒体艺术之都”的长沙,马栏山视频文创产业园的工程师们对AIGC(人工智能)的探索不局限于文本,还有适用于电视、手机等设备的数字艺术形象九游娱乐APP下载,让人们看到了AI赋能音视频文创的实力。
这个“数字人”就像是主播的分身,TA可以“读”直播间的评论并作出反馈,可以和其他主播对话PK,可以跟随音乐来跳舞,可以介绍商品属性,甚至可进行24小时不间断的直播。
“数字人”并不是新生物,但在视超智算自主研发的3D生成大模型的平台基础上,只需要真人原型图片加上一些文字描述,很快便能得到靠近原型的“数字模型”,并且有交互功能。也就是说,这一套大模型在未来可以快速、批量地生产“数字人”,以往需要花费几个月甚至几年时间才能制作“数字人”九游娱乐APP下载,未来将像拍照一样简单,大大缩短其生产周期,以应用至各行各业。
“目前这一变革在文创产业的效果是比较明显的,平时我们会接到一些新的需求。”黎维说,比如有客户想要为老人定制子女分身“数字人”。“在还原真人外貌特征的基础上,还可以导入真人的思维模式、记忆等,老人可以通过与‘数字人’对话获得一些情感安慰。”
目前专注于AIGC的黎维,原本学习的是数学专业。毕业后,他曾经在北京、青岛工作过一段时间,主要从事数据分析类工作。后来,当萌生来长沙工作的想法时,他考虑转型。
2017年,长沙打响“世界媒体艺术之都”名片,这启发黎维往视频制作、文化创意等领域靠近,并开始着手一些图像处理工作。很快,一个逐步冲击到各行各业的变革时代悄然靠近。
黎维说,生成式人工智能在经过几年技术累积后,突然在近两年爆火。大家对人工智能有了新的认识和期待。“以前的一些智能语音音箱,我们经常会听到它说‘抱歉,这个我还没有学会’,那我们就会感受到它的智能有局限性。而现在的一些生成式人工智能应用,它的学习能力是很强的,有了飞跃式的进步,这实际上是背后有了越来越大的算力支撑。”
通用型人工智能的时代已经到来了,黎维和身边的从业者明显地感受到,尤其文创行业受到很大影响。
“算力有多大,AI的能力就有多强,算力的布局非常重要。”黎维向记者介绍,大量的数据积累是能够让算法跑得又快又准确的关键,而这正是马栏山在文创产业的优势所在。“马栏山聚集了非常多的影视公司,有大量的电视剧、电影等影像资料。这些资料在完成它的原本播放功能后,就可以作为大模型中的一部分视频数据,为我们加强算力。”
2023年9月,视超智算与国防科技大学计算机学院共同建设的全球第一台“视频超算”落地九游娱乐APP下载。它能够将13P的超强算力转化为生产力,实现音视频产业工业流水线式大生产,“视频超算”跑出了一条新赛道。
“从旷日持久到一顿饭工夫,未来我们能够按工业流水线的方式,大大提升音视频内容产出能力。”视超智算相关负责人说。超高清视频时代对视频分辨率的要求更高,由此产生的计算量也剧烈增加。在强大算力的支撑下,视超智算已经完成了对典型视频算法的重构甚至再开发的工作,实现了三维渲染、编解码、超分与插帧等视频功能的迁移。
视频超算平台拥有五大关键能力。该负责人介绍,首先就是算力入棚的能力。传统影视拍摄非常复杂,前期需要根据内容进行布景,后期则要用较长时间进行制作。而虚拟拍摄是将真实的世界克隆到计算机系统的虚幻世界里,演员、场景、灯光等都在“虚拟影棚”中,可以立刻成片,让综合制作周期和成本降低50%以上。
再就是云上制作能力。制作好的数字场景,通过云与虚拟拍摄现场无缝同步并上屏,现场导演即可直接在屏幕上观看并提出修改意见,后方的视频制作人员即时完成修改。
三是AI大模型的能力。有了视频超算的大算力,AI大模型的内容生成能力可得到充分发挥,大幅降低了人力成本。
四是大场景视频快速渲染的能力。此前需要两个月完成渲染的作品,现在只需要一天甚至几个小时就能完成,大幅缩短了整个视频作品的制作周期。
最后是算力总调度的能力。视频超算管理的算力不只是超算本身,还包括了整个园区所有的基础设施。未来,在算力层面,不仅连接马栏山许多企业自建的算力,还将拉通如同在长沙的湖南超算以及天津、广州、济南、成都等地的超算中心等更多的外部算力。
该负责人表示:“我们在算力建设方面还有更长远的计划,视频超算平台只是第一步。具体来讲,我们目前正在打造算力网络,除了视频超算平台自己的算力以外,还希望与更多的算力中心相结合。与此同时,将视频超算平台目前形成的视频计算、视频处理能力对外输出,为先进制造和新型工业化提供优质服务。”