当前位置: 首页>后端>正文

学院来信871:ChatGPT

关于【产业篇】的相关内容,我一直希望时效性能更持久,最好是6个月、1年回头看,仍觉得有价值。其实这篇早就写好了,但我想等这阵热度过去以后再发,同时也能加入一些自己的思考。

ChatGPT是2022年11月30日OpenAI推出的对话式AI,其实类似的AI产品每年都有不少,但这次却引发了很多讨论,其中一个重要原因是AI的语言类底层技术进步显著(另一个原因也许是市场没什么可炒作的主题了)。换言之,ChatGPT会“说人话”。既然会说人话,那么在其他领域的应用场景就更丰富了。

? ? ? ? ? ? ? ? ? ? ? ? ??

一、变化。

ChatGPT使用简单,只需向ChatGPT提出文字需求,它就会回答你,也可以进行编写代码、创作文本等指令。实际应用上,ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成,并一定程度上替代搜索引擎。

学院来信871:ChatGPT,第1张

其实根据人类输入的信息生成语言并非难事,难的是生成人类可以理解的自然语言。ChatGPT从GPT-3.5模型微调而来,Chat强调了其为了对话而优化,具有记忆能力,可以完成连续性对话。更先进的训练模型、更海量的训练数据,功能越来越全面,表现越来越类人。

学院来信871:ChatGPT,第2张

当然,ChatGPT仍有改进的空间,比如它可能生成不正确或荒谬的信息;也可能会有违反伦理道德的答案;由于其所基于的训练数据库仅截止2021年(而非基于实时数据),能给出的回答可能已经过时等。

学院来信871:ChatGPT,第3张

在对话时,它也可能出现前后矛盾的情况,自己打自己的脸。但这些都是小问题,相信下一代产品可以很好地解决这些问题。

学院来信871:ChatGPT,第4张

? ? ? ? ? ??

二、拟人。

此前一些AI模型仅有部分能力能通过图灵测试,而GPT-4有望完全通过图灵测试:在一个人和一台机器隔开的情况下,经过多次交流测试,如果AI让人做出超过30%的误判,那它就算通过了测试。换言之,你将很难分辨回复你的到底“智能客服”还是“人工服务”。

学院来信871:ChatGPT,第5张

OpenAI是ChatGPT的源头公司,2015年马斯克和Sam Altman等人共同创立了OpenAI nonprofit。OpenAI的主要投资者包括微软、Reid Hoffman’s charitable foundation和Khosla Ventures。OpenAI当前模型几乎涉及所有需要解决自然语言/代码的理解/生成任务的领域。简言之,我们可以直接调用包括文本、代码、图像等五大类的代码,而无需掌握代码本身。

学院来信871:ChatGPT,第6张

? ? ? ? ?

三、替代。

每次AI引发关注时,都绕不开这个话题:机器替人。智能制造已深入人心,在体力劳动方面,机器替人已经不是什么新鲜事。新鲜的在内容创作方面,是否会出现机器替人。

从内容创作模式来看,可以分四个阶段:①专业人士创作内容;②用户创作内容;③AI辅助用户创作内容;④AI创作内容。我们正从阶段②的全民创作向阶段③的AI+用户创作过渡。事实上,很多工具已经出现了,但功能尚需完善。

学院来信871:ChatGPT,第7张

比如,AI生成视频的难度就显著大于生成图像,在文字方面AI能对答如流,甚至可以写论文。但若要它做一个B站UP主出品的生动、有趣的视频,它目前还办不到。更确切地说,应该是能办到(能做出视频),但做不好(质量很一般)。与图文创作不同,视频除了要正确生成每个像素外,还需预测像素将如何随时间变化。类似“a person doing yoga”这种文字,AI若要将其变成文字,其复杂程度会呈几何倍数的提升。

学院来信871:ChatGPT,第8张

根据红杉资本的预测:预计2023年文本领域和代码领域的应用将十分成熟。但图像/视频/3D/游戏领域的成熟应用仍需要一定的发展时间。

学院来信871:ChatGPT,第9张

四、成熟。

成熟:AI ≥ 人类。比如,在绘画领域,AI绘画作品就已经出圈,且一级投资活跃。2022年8月,美国科罗拉多州举办的新兴数字艺术家竞赛中,作品《太空歌剧院》获得了“数字艺术/数字修饰照片”的一等奖,参赛者没有任何绘画基础,仅通过AI绘图软件Mid Journey耗时80个小时创作了该作品。

学院来信871:ChatGPT,第10张

AI绘画技术发展很快,从2022年初的技艺生疏到能够生成专业级别的图像仅过去几个月的时间,目前国外已有Stable Diffusion、Midjourney等多个成熟的AIGC平台。其中技术领先的AI公司Open AI当前估值或达290亿美元,Stable Diffusion背后的Stability AI估值也达到10亿美元。

尚未成熟:AI ≤ 人类。比如,之前提到的视频生成领域,智能视频生成虽有部分应用,但生成的视频时长较短,且部分视频无法准确再现真实世界的运作方式,AI视频生成技术到成熟应用还有一段距离。目前由Meta2022年9月推出的Make A Video,支持由文字描述生成短视频、支持输入图像制作视频、支持输入视频创作新视频。但其生成的视频存在时长较短、清晰度较低、无法复现现实中的动作或逻辑等问题。国内的百度、知乎、抖音、头条、腾讯的平台都上线了类似功能,但仍有待提升。

学院来信871:ChatGPT,第11张

百度智能创作平台:百度AI推出的一站式内容创作助手平台,涵盖文章创作、视频生成和视频智能编辑。我用过它的图文转视频,目前看来,就是一坨xx,但若给它足够的世界,未来这坨xx应该会很香。

? ??

五、结语。

随着文本类AI进入新阶段,拥有海量文本创造需求的公司将大大收益,比如网文平台、新闻平台。此外,底层硬件需要会大增,比如高算力的AI芯片。

随着深度学习模型不断完善、开源模式的推动,生成式AI能通过组合性创作的方式突破创意局限:①继续性创作,如AI续写文案、生成同一风格系列的图片等;②组合性创作,如将不同领域、不同维度的元素进行组合,创造出新的概念元素。2021年,Anurag Sarkar和Seth Cooper使用VAE(Variational auto-encoder)将不同的游戏关卡进行组合,创造出了一个新的融合了塞尔达、银河战士、洛克人的关卡。

学院来信871:ChatGPT,第12张

之前提到的Mid journey非常擅长创作奇幻、科幻类型的风景图片。目前该公司主要采用会员费模式,用户可以基于使用量的需求,选择不同套餐,每月费用在10-50美元之间;B端用户为固定价格,每年费用为600美元。

学院来信871:ChatGPT,第13张

指令:moody, dark, chiaroscuro

学院来信871:ChatGPT,第14张

指令:textured, summertime, warmth, bokeh, lotus on a pond in reflection, cinematic photograph

附:涉及AIGC领域的文/音/图/视频企业列表

学院来信871:ChatGPT,第15张

祝大家生活愉快。


https://www.xamrdz.com/backend/35g1938435.html

相关文章: