多模态端到端实时推理,无需转换,响应延迟大幅缩短:前代GPT-3.5和GPT-4对话模式可拆解为三步:音频转录为文本、模型接收文本并输出文本半岛bd体育、文本转换回音频,意味着GPT-4丢失了大量信息—无法直接观察音调、多个说话者或背景噪音,亦无法输出笑声、歌唱或表达情感,GPT-3.5和GPT-4的平均响应延迟分别为2800ms和5400ms。而GPT-4o将所有输入和输出由同一神经网络处理,可实现跨文本、视觉和音频端到端实时推理,模型响应延迟缩短至232ms,平均响应延迟为320ms,接近人类日常对话的反应时间;多模态交互能力优越,能够接受文本、音频和图像的“混合”输入,快速响应完成推理。
价格减半,模型能效翻倍提升:与GPT-4Turbo相比,GPT-4oAPI在推理速率提升2倍、单位时间调用次数提升5倍的同时,价格减半。
免注册免费开放使用,功能多元化:用户无需注册即可免费使用全部功能,包括:1)体验GPT-4级别的智能;2)由模型或网络抓取生成答案;3)分析数据并创建图表;4)解析所上传的照片;5)帮助总结、生成或分析所上传的文件;6)使用GPTs及GPT商店;7)使用模型的“Memory”(记忆)功能。但免费用户在消息数量上存在限制,超过限制后将被切换回GPT-3.5。
情感交互及语言能力再升级:GPT-4o展现出对人类交流习惯的高度理解力和适应性,可准确识别和响应人类情绪,并提供更具情感、个性化的回应。另外,GPT-4o在50多种语言(可覆盖约全球97%的人口)中的处理速度及质量提升,实时翻译功能可助力不同语言使用者交流。
macOS无缝集成ChatGPT,UI界面优化:OpenAI推出适用于macOS的ChatGPT桌面应用程序,旨在将AI无缝集成至PC。使用键盘快捷键(Option+Space),即可向ChatGPT提问、在应用程序中截取屏幕截图并进行讨论。另外,公司为ChatGPT优化UI界面,新版本主屏幕及消息布局等更简洁且更具易用性。
投资建议:GPT-4o发布预示着AIAgent新一轮竞争序幕即将拉开,叠加macOS桌面版ChatGPT集成,端侧AI革命在即,此外B端企业服务市场可能会因为GPT-4o的易用性和普惠性而迎来新的增长机遇。建议重点关注:1、端侧AI:中科创达、萤石网络、科大讯飞、小米集团-W、虹软科技;2、垂直行业AI应用:AI+教育、AI+办公、AI+医疗、AI+金融有望加速爆发半岛bd体育,重点推荐彩讯股份、嘉和美康、金山办公、同花顺、拓尔思等。
风险提示:技术研发进度不及预期风险;供应链风险;政策推进不及预期风险;消费需求不及预期风险;行业竞争加剧风险。