最近,OpenAI 又一次带来了惊艳的更新——GPT-4o正式上线了原生多模态图像生成功能!经过长达一年的精心优化,GPT-4o不仅全面超越了之前的DALL-E 3,还带来了令人惊叹的新特性,甚至达到了比人类设计师更高的设计水准。接下来就和大家分享一下GPT-4o的几大突破性更新:
一句话指令,生成效果超过人类精心设计
只需在ChatGPT中输入简短的文字描述,就能在不到一分钟的时间内,得到精准、逼真的图片效果。无论是设置宽高比、色号、透明度,还是复杂细节要求,都可以轻松搞定。
GPT-4o图像生成功能的四大亮点:
- 精准渲染图像内文字:过去AI对图片中的文字生成一直不够精准,如今GPT-4o能够准确生成logo、菜单、邀请函甚至复杂的信息图,效果清晰、美观且位置恰当。
- 精确执行复杂细节指令:即使构图复杂,细节繁多,GPT-4o依旧可以精准地呈现你的构想,不再受限于指令的复杂性。
- 强大的上下文扩展能力:支持在聊天历史基础上扩展生成图片,确保多次互动之间图像风格和细节的一致性。
- 多风格自由切换:从手绘草图到超写实风格,GPT-4o可以轻松驾驭各种艺术风格,随意转化。
此外,GPT-4o还整合到了OpenAI的视频生成平台Sora中,进一步提升了其多模态能力。
GPT-4o相较过去模型的重大提升:
- 文字嵌入精度提升:准确将文字清晰嵌入图像。
- 上下文理解增强:支持在互动中细化并保持多次生成的连贯性。
- 多对象精准定位:一次可准确定位和渲染10-20个不同对象。
- 风格多样化适应:能将图像在多种艺术风格间自由转换。
目前GPT-4o已经取代了DALL-E 3,成为ChatGPT各版本的默认图像生成引擎(包括Free、Plus、Team及Pro版本)。企业版、教育版以及API接口也将很快跟进开放。
科技的进步果然超乎想象,GPT-4o的出现,再次证明了AI设计超越人类,已是必然趋势。让我们一起来感受下GPT-4o惊艳的生成效果吧!
添加图片注释,不超过 140 字(可选)
GPT-4o生成图片效果展示
除了通过GPT-4o可以在ChatGPT中直接生成图像,该模型还整合进了OpenAI的视频生成平台Sora,进一步扩展了其多模态能力。
新模型即日起将作为ChatGPT的默认图像生成引擎,向ChatGPT Free、Plus、Team及Pro用户开放,取代此前使用的DALL-E 3企业版、教育版以及API接口也将在不久后支持该功能。
据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进:
更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中; 增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性; 改进的多对象绑定:过去的模型在正确定位场景中的多个不同物体时存在困难,而GPT-4o现在可以一次处理多达10至20个物体; 多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。
让我们看看,目前4o生图可以做到的水平吧!
4o目前生图水平
1、一句话老照片上色
添加图片注释,不超过 140 字(可选)
2、一句话修改图片
添加图片注释,不超过 140 字(可选)
3、一句话做成鸟瞰图
添加图片注释,不超过 140 字(可选)
4、一句话图标风格设计
添加图片注释,不超过 140 字(可选)
5、一句话将原图改风格
添加图片注释,不超过 140 字(可选)
6、一句话将图像转换样式
添加图片注释,不超过 140 字(可选)
7、一句话融图创建新图像
添加图片注释,不超过 140 字(可选)
8、建一个高保真的产品模型吗?”。
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
9、一句话根据图片生成漫画
添加图片注释,不超过 140 字(可选)
现阶段,GPT-4o取得了许多进步,但它仍然存在一些问题,其中包括:
裁剪问题:像海报这样的较大图像可能会被过度裁剪; 非拉丁字符的文本准确性:某些非英语字符可能无法正确呈现; 小字体中的细节保留:小字号文本的细节可能会丢失或不够清晰; 编辑精确度:修改图像的特定部分时,可能会意外影响其他元素。
OpenAI表示,正在通过持续的模型改进积极解决这些问题。
怎么才能用上最新版 GPT-4o?
目前,可以确定的渠道是付费的 OpenAI 的 Plus、Pro 和 Team 用户。
但是海外使用有点困难,所以整理了一些其他的方式,小伙伴们可以尝试使用,接触一下4o生图的功能。
千言万语其实不如你自己实际体验一下,快来领会一下科技的魅力。
一些使用4o的方式
1、官网
没错,如果有能力的话,建议还是直接去官网使用,体验相当nice。
就是价格稍微贵,需要20美刀,不过这个价格打包市面上OpenAI对话模型、视频、图片、语音给你使用。我觉得也合理。毕竟免费才是最贵的。
使用地址:https://chatgpt.com/
2、wildcard / yeka(推荐)
wildcard / yeka是一种跨境支付虚拟信用卡使用前需充值余额),主要为那些无法直接使用本地信用卡或借记卡支付海外服务的用户提供解决方案。此类服务包括 OpenAI、Midjourney、ChatGPT Plus 等。它支持通过支付宝进行余额充值,且无需上传身份证明文件,无需实名认证。
添加图片注释,不超过 140 字(可选)
使用教程:ChatGPT Plus充值教程:新手必看,WildCard使用指南 – 智技AI
3、chatshare(推荐)
国内最大的镜像站之一,主要提供OpenAI和Claude的镜像服务。目前账号充足,采用自购账号和API方式接入官网服务。运行时间长,可靠稳定。
添加图片注释,不超过 140 字(可选)
注册后需使用激活码订阅,订阅完成即可使用。具体不多说,需要的可自行了解。
使用地址:chatshare.biz
激活码获取:国内版GPT,ChatShare 镜像购买 教程 – 智技AI
4、Salck
大佬通过OpenAI官网的API在Slack配置的一个应用。 加入他的Slack工作区就能直接使用GPT-4o、Gemini模型。而且工作区里面还有Claude3.7系列模型可以使用。目前Slack可以在电脑、手机、网页使用,可以说是很方便了。
添加图片注释,不超过 140 字(可选)
注意,加入工作区一般需要使用国际邮箱,用微软的outlook邮箱就好了。首次加入需特殊环境(需自行准备)。加入完进入工作区在频道@GPT4应用即可。
5、lmarena
进入竞技场后点击DIRCTChat,然后选择4o模型就好。
需要注意的是,模型竞技场有些时候会因为没有次数额度下架4o模型使用。你可以去试试看,如果没有的该模型选项的话,晚会再进去试试。
注:首次进入稍微卡,需要等待一会。
使用地址:https://h5ma.cn/lpi
如果可以,希望小伙伴们点赞和收藏,这是我的更新动力! 如果可以,希望小伙伴们点赞和收藏,这是我的更新动力!