2023年的人工智能赛道,自微软打响注资OpenAI头一炮后,热度逐渐升温。海内外科技巨头纷纷加入AI军备竞赛,至3月中下旬渐至白热化。从底层硬件至终端应用,近一周时间内,各家头部竞争者纷纷加快产品发布节奏,本文将盘点一周AI行业竞争白热化的战况。
[云服务]谷歌向开发人员开放其大语言模型PaLM的API接口
PaLM是是谷歌在2022年发布的语言大模型,而后又在此基础上发布了逻辑性更强的大模型PaLM-E,可处理多模态信息。本次API接口开放后,用户能通过谷歌云和AI建构工具MakerSuite来构建AI模型,并根据特定要求定制API,比如将聊天机器人功能编程到特定的应用程序中。
[AI+办公]谷歌所有Workspace办公组件将上线生成式AI功能
图源:Google Workspace演示页
Google Workspace是谷歌的一整套办公组件,包括Gmail以及Google Doc、Sheets、Slides等。谷歌将生成式AI模型接入后,用户将拥有通过剪短摘要在Gmail中生成完整电子邮件的选项,以及生成AI图像,音频和视频等新应用。此举显示了谷歌在AI军备竞赛中保持领先地位的决心。也喻示着AI协同办公新时代开启。
[大模型] OpenAI发布多模态预训练大模型GPT-4
图源:OpenAI官网GPT-4介绍页
相比上一代模型,GPT4.0升级显著,文字输入限制提升了7倍、开始支持图像输入、回答准确性显著提高、创作能力进一步提升、幻觉问题得到改善、安全防护能力增强。在解释梗图和对创造力要求较高的人类考试中表现亦优秀。但随着模型复杂度加大,也大幅提升了算力需求。
[大模型]百度发布大语言模型、生成式AI产品文心一言
发布当日,百度展现了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五大方面的能力。背后是百度从芯片层(昆仑芯)、框架层(飞桨)、模型层(文心大模型)、应用层(C端应用、B端应用)的全栈人工智能技术。在3月27日,百度将召开新品发布会,发布文心一言云服务及应用产品。
[AI+办公]微软发布Microsoft 365 Copilot,将AI功能全面接入Office等应用软件
图源:Microsoft 365 Copilot介绍页面
Microsoft 365 Copilot无缝集成了GPT-4模型,提供的功能包括包括编写和编辑文档、制作演示文稿、完成数据分析和制成可视化图等。使办公场景的AI助手应用跨入新阶段。机构认为有望从根本上改变人们的工作方式,并开启新的生产力增长浪潮。
[AI+图像]Midjourney生成的人类情侣图片刷爆互联网
Midjourney v5是AI图像生成式应用Midjourney的最新迭代版本,解决了手指无法准确描绘的问题。经测试,Midjourney v5生成的1990年代中国情侣照片效果逼真。机构认为,随着AIGC工具加速迭代,各类场景下的商业应用有望率先落地。
[底层硬件]NVIDIA在2023GTC大会上发布四种配置与体系架构的推理平台L4|L40|H100 NVL|Grace Hopper、GPU光刻软件NVIDIA cuLitho
其中,H100 NVL是两个H100 GPU通过NVLink拼接在一起的非消费级GPU,专门用于训练大型语言模型(LLM)。机构认为,计算成本是讨论AI应用发展的核心问题,本次英伟达推出更高效算力方案为行业解决基建痛点。
Nvidia DGX Cloud使企业不需要采购与拥有服务器设备,可通过云服务供应商合作托管的DGX Cloud基础设施租用算力,价格为37000美元/月。随着算力租用的开放,任何企业都可拥有构建AI的可能。英伟达方面表示,甲骨文将成为租用服务的第一个合作伙伴,微软、谷歌云也将加入。
[云服务]谷歌Bard有限开放公测
Bard是ChatGPT的竞品,曾于2023年2月8日,微软将ChatGPT接入Bing搜索引擎时短暂上线,因出错遭谷歌撤下相关演示的官方视频。3月重新发布的Bard测试版目前仅支持英语,且不具备编码能力。但谷歌强调本次为“早期实验”。
[AI+视频]Runway发布文字生成视频模型Gen-2
[AI+图像]Adobe发布创意生成式AI应用Firefly
机构表示,应用端在AIGC的加持后,有助于提升数字内容的体验,从文字、图片、视频、短视频、沉浸式、互动式等媒介的演变,均说明新技术可带来内容、媒介发展新红利。”