ai数字人吧 关注:94贴子:370
  • 0回复贴,共1

2023年AI大事件回顾:AI巨头们的激战与未来展望

只看楼主收藏回复

2023 年已经过了99.99999% 。
如何总结 2023 年?显而易见的答案是「人工智能『AI』」。

在这个被称为「 AI 元年 」的特殊年度,继 GhatGPT 腾空出世之后,谷歌、微软、 Meta 、百度、阿里巴巴、科大讯飞、腾讯、小米、等企业紧随其后,开启了全球的「百模大战」。
而人工智能、 AIGC 、 AGI ,也一度成为了贯穿 2023 年的「热词」。这些『事件』和『关键词』不仅塑造了人工智能的未来,更也深刻地影响了我们的生活方式。
随着「AI元年」的2023年即将结束,崭新的2024正踏浪而来,今天不妨跟着小智一起回望这个不平凡的「AI元年」——『2023』。「篇幅有限,如有遗漏敬请谅解」。

1月:
微软追加注资 OpenAI 数十亿美元,全球人工智能商业化落地按下「加速键」
谷歌AI发布文字-图像生成模型 Muse (缪斯),该模型在CC3M 数据集上达成了新 SOTA(目前最佳水平)。
特斯拉发布最新自动驾驶软件,称将改进车辆的导航、控制和自动变道等功能。
百度举办 Create AI 开发者大会,发布了跨模态大模型「知一」和新一代索引「千流」,展示了文心 ERNIE 3.0 Zeus 、文心 ERNIE-ViLG 2.0 以及视频内容生成与编辑技术。

2月:
OpenAI 宣布推出新的人工智能模型 GPT-3.5 ,并表示将在未来几个月内发布更大规模的GPT-4 模型 2 。
Google 发布对标 ChatGPT 的聊天机器人 Bard ,但因出错遭谷歌撤下相关演示的官方视频。
微软发布集成 ChatGPT 功能的 New Bing。
Meta 发布大型语言模型 LLama 并开源,该模型支持生成文本、对话、总结书面材料、证明数学定理、预测蛋白质结构等功能。
复旦大学发布国内第一个对话式大型语言模型MOSS 。

3月:
ChatGPT 的开发机构 OpenAI 正式发布 GPT-4.0 。同时引入 ChatGPT Plugin,ChatGPT 支持「联网」。
谷歌发布新的 AI 语音助手,可支持多种语言和语音 1 。并且,再次公测 AI 聊天机器人Bard 。
微软宣布推出新的办公助手 Microsoft 365 Copilot ,全面接入 GPT-4 并将能力融入 Office 365 全栈生产力工具,较大提升了数字化办公的智能化水平,可有效解放重复性的基础办公劳动力。
百度集团正式推出大语言模型——文心一言( ERNIE Bot ),百度展现了其在文学创作,商业文案创作、数理推算、中文理解、多模态生成五大方面的能力,它的出现,也正式拉开了国内大模型「百团大战」的序幕。
图像软件公司Adobe宣布推出名为「萤火虫」( Firefly )的创意生成式 AI ,内容创作者可使用文字来生成图像、音频、插图、视频和 3D 图像。
斯坦福发布 Alpaca ,用不到 100 美元成本,实现比肩 GPT 3.5 的性能。
Mindjourney V5 发布逼真情侣照。

4月:
阿里云宣布自研大模型「通义千问」开启企业邀测,该模型支持多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。
复旦大学发布 MOSS 大模型的开源版。该模型是一个开源的对话语言模型,包含 160 亿参数,可用于生成对话、文章、代码等多种应用场景。
字节跳动推出企业软件飞书 AI 助手「My AI」。
微软宣布将 GPT-4 接入 Office 套件,推出 Microsoft 365 Copilot。
苹果宣布推出新的人工智能平台,可支持多种应用和服务。
Meta 正式推出模型 SAM(Segment Anything Model) 。该模型是第一个用于图像分割的基础模型,能够通过文本指令等方式实现图像分割、物体识别和「抠图」等功能。

昆仑万维发布千亿级大语言模型「天工」中国第一个真正实现智能涌现的国产大语言模型。
商汤科技宣布推出「商汤日日新大模型」,同时,商汤科技还宣布推出涵盖 1800 亿参数的自研中文语言大模型应用平台商量 Sen-seChat 与 4 个 AIGC 应用。

5月:
ChatGPT APP 上架 Apple store。
特斯拉人形机器人(Optimus)进化。
Google 发布号称超越 GPT-4 的大模型 PaLM 2 ,同时宣布正在开发更强的 Gemini 多模态大模型。
微软宣布将与 OpenAI 合作,共同开发人工智能技术和应用。
微软推出 GPT-4 版 Windows,期望让整个 PC 操作系统实现对话机器人的交互效果。
科大讯飞正式发布讯飞星火认知大模型,多项产品应用已落地,如 Al 学习机、智能办公本、智能录音笔等。
Meta 推出了开源 AI 语言模型——大规模多语言语音(Massively Multilingual Speech, MMS)模型。该模型可以识别超 4000 种语言,支持 1100 多种语言文本语音互转。
云从科技发布从容大模型。
三六零发布「 360 智脑-视觉大模型」。

6月:
悟道3.0 大模型发布并进入全面开源新阶段,包含悟道·天鹰( Aquila ) 语言天模型系列、天秤( Fla-gEval )大语言评测体系及开放平台以及悟道·视界视觉大模型系列。
英伟达发布新的人工智能芯片,可支持更大规模和更高精度的模型训练和应用。
人工智能框架生态峰会 2023 在上海举办。中科院自动化所正式发布「紫东太初」全模态大模型。
人工智能公司 Runway 发布带有 AI 功能的视频编辑工具 Gen-2,用户可以直接使用文本提示生成逼真的视频内容并自动剪辑视频。

7月:
360 发布 AI 智脑 4.0 及数字人广场。
Meta 推出免费可商用的大语言模型 Lama2 ,包含 70 亿、 130 亿和 700 亿三种参数类型,可免费用于商业或者研究。
百度文心一言 APP 正式推出。
华为云正式发布盘古大模型 3.0,为中国首个全栈自主的 AI 大模型。
马斯克高调官宣成立 xAI 。
2023 世界人工智能大会在上海举办。大会期间,上海人工智能实验室与商汤科技联合香港中文大学、复旦大学、上海交通大学及清华大学发布全新升级的「书生通用大模型体系」。
谷歌宣布推出新的人工智能模型,可自动识别和分类图像, Bard 更新版,可支持包括中文在内的 40 多种语言。
程序序设计领域知名问答网站 Stack Overflow 推出Overflow AI 代码工具,用于补充社区问答的不足之处,并支持一对一帮助用户开发代码等功能。

8月:
谷歌宣布推出新的人工智能模型,可自动识别和分类图像。
阿里巴巴发布通义千问 7B 模型,开源免费可商用,支持 8K 上下文长度。
字节跳动推出自己的 AI 模型「豆包」,目前正在公测没有全屏水印。

Meta 基于羊驼推出编程专用模型 Code Llama ,提供开源版并支持商用。
OpenAI 宣布推出 ChatGPT 企业版,无限高速 GPT-4 提问/输入更长/数据私有。
斯坦福「虚拟小镇」开源。

9月:
百度发布医疗大模型「灵医大模型」。
科大讯飞宣布讯飞星火大模型面向全民开放。
腾讯混元大语言模型在 2023 腾讯全球数字生态大会上正式亮相。
阿里云宣布通义千问大模型正式向公众开放,个人用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问 API 。
「鹏城·脑海」通用 AI 大模型正式发布。该模型由鹏城实验室联合中国外文局、华为、腾讯等单位共同研发。
360 智脑大模型全面接入 360 全家桶,正式面向公众开放。
OpenAI 宣布推出 DALL-E 3 ,可以基于 ChatGPT 生成提示词创建更复杂的图片。

10月:
YouTube 宣布推出新的 AI 工具,帮助广告商触达受众。
百川智能推出大模型 Baichuan2-192K ,一次可输入 35 万字,是 Claude 2 的 4.4 倍、 GPT-4 的 14 倍。
Hugging Face 基于欧洲初创公司 Mistral AI 的开源模型 Mistral 7B,推出了 Zephyr-7B 迷你语言模型。Zephyr-7B 采用了蒸馏直接偏好优化(dDPO)方法,显著缩短了训练时间。在基准测试中,Zephyr-7B 略胜 Mistral 7B,甚至可以媲美具有 70 亿参数的 LLaMA-2。
百度发布文心大模型 4.0 。号称完全对标 GPT-4 。
科大讯飞举办开发者大会,正式发布讯飞星火认知大模型 3.0 。
腾讯混元大模型迎来升级,正式开放「文生图」功能,升级后的腾讯混元中文能力显著增强,代码能力提升 20% 。
知名商业图库素材平台 Shutterstock 推出系列人工智能工具,允许用户使用 AI 编辑图像。
美国总统拜登签署行证令:各家公司研发 AI 大模型前必须提前报备。

11月:
OpenAI 举办开发者大会。大会期间, OpenAI 推出 GPT-4 Turbo 模型,并发布 GPTs 和 GPT Store 。同时,OpenAI CEO 萨姆·奥特曼(Sam Altman)被董事会解除职务。
文生视频产品 Pika 1.0 正式发布。
英国举办首届全球人工智能安全峰会,峰会发表《布莱切利宣言》,旨在促进全球 AI 安全合作
马斯克 X.AI 发布 AI 大模型产品—— Grok 。该模型自带幽默和嘲讽技能,将对标 ChatGPT 。

知名投资人、创新工场董事长兼 CEO 李开复创办的 AI 2.0 公司「零一万物」发布了首款开源大模型—— Yi 系列大模型。
腾讯云推出 TACO-LLM 大语言模型推理加速引擎,用于提高语言模型的推理效能。
Stability AI 推出 AI 视频生成模型 Stable Video Diffusion 。 Stability AI 推出 SDXL Turbo ,可实时输入文本生成图像。

12月:
英伟达发布新的人工智能芯片,可支持更大规模和更高精度的模型训练和应用
谷歌正式推出大语言模型Gemini 1.0 ,这是谷歌对标 OpenAI GPT 模型的竞品,该模型共有三个版本—— Ultra(能力最强)、Pro 和 Nano。
Stability AI 推出图像生成 3D 对象的模型 Stable Zero123。
法国人工智能初创公司 Mistral AI 发布了其最新开源大语言模型 Mixtral,该模型采用混合专家模型( Mixture of Experts,MoE )架构。
OpenAI宣布推出 ChatGPT 企业版,无限高速 GPT-4 提问/输入更长/数据私有。
抖音和哔哩哔哩 强制标记 AICG 相关内容以对抗网络虚假信息和不适内容。
MidJounery V6 发布。
写在最后:
回顾 2023 年,是人工智能井喷式爆发的一年,也是至关重要的一年。然而,技术飞跃预示社会文化变革。当下的 AI 在重塑生活工作方式的同时,也引发着伦理隐私就业创新思考。相信随着 AI 的不断进步,我们会在未来寻找到一个平衡点,并充分借用 AI 优势解决我们即将、或将要面对的难题。同时,小智也相信, 2024 年 AI 技术还将持续「加速」,还将获取更加深入的认知能力,与人类社会协同创造新时代。


IP属地:安徽1楼2024-01-02 10:56回复