OpenAI今日发布GPT-5,支持文本、图像、音频、视频无缝融合处理。
OpenAI于今日正式发布GPT-5模型,标志着大语言模型进入全面多模态时代。GPT-5不仅支持文本生成,还能同时处理图像识别、音频转写、视频内容理解,并实现跨模态推理。在多项基准测试中,GPT-5在视觉问答、语音合成和长视频摘要任务上超越此前所有模型。OpenAI CEO Sam Altman表示,GPT-5将首先通过API向开发者开放,消费级产品将在未来几周内上线。此举引发了行业对AI应用场景扩展的广泛讨论。