尽管 OpenAI 尚未向 GPT-4 发布其最令人期待的多模态功能,即让你上传图片并提出相关问题,但不出所料,微软已经提前推出了图片上传功能。是的,你现在可以将图片上传到必应聊天工具,并与 GPT-4 模型聊天了。它的工作原理与 OpenAI 在 GPT-4 发布会上演示的一样。
有了多模态功能,必应聊天软件基本上具备了视觉功能,现在还能理解图像。你可以用它来研究医疗报告、获取食物的营养数据、解决数学问题等等。现在,要学习如何在必应聊天中使用 GPT-4 的多模态功能,请跟随本教程学习。
1. 首先,在电脑上启动 Microsoft Edge 并打开必应(访问)。您也可以在智能手机上安装必应应用程序(Android 和 iOS,免费)。
2. 然后,点击左上角的 “Chat“。
3. 进入 “Creative” 模式后,您可以免费与 GPT-4 模型聊天。
4. 现在,您可以在下面的文本字段中找到一个 “image” 按钮。这将允许您上传图像并访问 GPT-4 多模态功能。
5. 点击图片按钮,上传图片文件。如果需要,也可以粘贴图片 URL。
6. 我上传了一张在纸上快速涂鸦的网站图片。现在,让 Bing Chat 创建一个这样的网站,并为网站生成 HTML 和 CSS 代码。
7. 好了,就是这样。基于 GPT-4,Bing Chat 利用其多模态功能立即生成 HTML 和 CSS 代码。
8. 粘贴代码并运行后,您会看到下面的网站。不错吧?它能正确识别我的笔迹,布局也很相似。这就是 GPT-4 在必应聊天中的多模态功能。
9. 另一个例子是,我上传了一个复杂的房屋 CAD 设计图,并向它提出了几个问题,从铁的数量到与设计相关的问题,它都做得非常出色。
10. 接下来,我要求必应聊天解决两道数学题,它都正确地解决了。
11. 最后,我上传了一幅有趣的漫画,并要求必应聊天工具解释这个笑话。但这一次,它没能听懂这个笑话。不过,GPT-4 的多模态功能非常强大,你可以尝试无限的使用案例。
原文地址:https://www.wbolt.com/how-use-gpt-4-multimodal-bing-chat.html