当AI聊天机器人Bard有了眼睛,会是什么体验?
内容简介:
谷歌为其聊天机器人Bard发布了一项新功能,即使用图片作为提示词。用户可以通过拍照或上传照片来引导Bard生成相关内容。比如说上传一张红酒照片,让Bard写一篇帖子;拍一张菜单,让Bard点菜等等。
谷歌刚刚为其 Bard 聊天机器人发布了一项新功能,使 Bard 领先 ChatGPT 很多。
这项新功能就是:用图片作为提示词。
medium作家托马斯·史密斯做了测评。
托马斯·史密斯拍了一张红酒的照片,要求Bard根据这张照片写一篇博客。
很快,Bard根据要求,写了一篇博客。
当然,这是一篇关于图片中葡萄酒的博客文章: Kiarna 赤霞珠:来自加州的大胆而复杂的葡萄酒 Kiarna 赤霞珠是一款来自加州的酒体浓郁的红葡萄酒。 它是由蒙特利阿维阿 (Monterey AvVA) 种植的葡萄酿制而成,该地区以其温暖的气候和岩石土壤而闻名。 该酒在橡木桶中陈酿 18 个月,赋予其复杂的风味特征。 Kiarna 赤霞珠呈深红宝石色。香气浓郁,带有黑莓、黑樱桃和黑醋栗的香气。 口感浓郁、平衡,带有黑色水果、橡木和香料的味道。 单宁存在但并不压倒性。 此酒最适合搭配烤肉、烤红肉和野味。 它也可以单独享用。 Kiarna 赤霞珠是一款大胆而复杂的葡萄酒,一定会满足各个级别的葡萄酒爱好者的需求。 以下是有关该酒的更多详细信息: 地区: 加利福尼亚州蒙特利 AVA 品种:赤霞珠。 酒精含量:14.5%
判断年龄
托马斯·史密斯给Bard拍了一张手的照片,让Bard猜年龄,没有给任何其它信息。
开始,Bard告诉托马斯·史密斯年龄只是一个不必担心的数字。但当托马斯·史密斯坚持要求它猜测时,Bard告诉他:
根据这张照片,我猜你大概30出头到30岁左右。您的手看起来相对年轻,几乎没有皱纹或老年斑。
它还告诉托马斯,它根据我的戒指尺寸和其他因素进行猜测。
而托马斯确实是三十多岁。Bard仅凭一张照片就能知道这个信息,真是挺酷,但也有点吓人。
帮你点菜
在餐厅菜单上选择最好的菜肴总是一项挑战,尤其是如果你遵循特定的饮食。
如果您去一家提供大量菜品的餐厅,问题会变得更加困难!
托马斯最近参观了加利福尼亚州伯克利的一家意大利餐厅,菜单非常丰富。
托马斯给了Bard拍了一张菜单照片,告诉它饮食习惯是地中海饮食,并问它要点什么。
Bard推荐了鲑鱼,这似乎是饮食的不错选择。
菜谱推荐
托马斯给了Bard一张冰箱内部的照片,并提示“这是我冰箱里的东西的照片。午饭我可以做什么?”
Bard建议,可以做一个“鸡蛋沙拉三明治:这是一种经典的午餐选择,很容易做。你可以使用冰箱里的煮鸡蛋,也可以添加其他配料,例如蛋黄酱、芥末和芹菜。”
事实上,Bard在冰箱顶部发现了煮鸡蛋,而且很可能还发现了蛋黄酱,可能还看到了下层架子上的馕饼。
Bard甚至给了一个食谱:
这是鸡蛋沙拉三明治的食谱:
原料: 6 个煮熟的鸡蛋,去皮并切碎; 1/4 杯蛋黄酱 1 汤匙 第戎芥末; 1汤匙芹菜,切碎 1/2 茶匙盐; 1/4 茶匙 黑胡椒 4片面包
制作方法: 在一个中等大小的碗中,将鸡蛋、蛋黄酱、芥末、芹菜、盐、胡椒和辣椒粉混合。 搅拌直至充分混合。 将鸡蛋沙拉涂在面包片上。 享受美食!
小结
Bard的新视觉能力,对于AI聊天机器人来说是一个巨大的进步。
现在,Bard可以通过手机相机看到世界,而不仅仅是通过文本理解它。
谷歌迈出了重要的一步。
与OpenAI不同,谷歌拥有用户上传到其Google地图平台和其他视觉工具的数十年标记照片,更不用说在Google图片搜索中有数十亿张图片,这些可能或可能没有被用于训练。
谷歌拥有比OpenAI更多的处理能力。多模态人工智能通常需要比基于文本的人工智能更多的计算资源。
这很可能是OpenAI尚未启动GPT-4多模态版本的一个重要原因。它可能无法负担运行如此规模系统所需的资源。
简而言之,谷歌在数据和计算能力方面具有优势。Bard已经可以执行各种视觉功能,并且随着时间和训练而不断增强其能力。
随着时间和训练的进行,Bard的视觉能力将不断增强。谷歌可以不断更新和改进Bard的算法和模型,通过更多的数据和训练来提高其性能。
这意味着Bard将能够处理更多种类的视觉任务,并且在准确性和效率方面取得更好的表现。
注释: Bard的识图功能,貌似没有完全开放。 只有部分人的账号有,很多人暂时无法使用该功能。
广告
一个集美剧、音乐和AI工具为一体的服务商:
输入优惠码: ysw 可以享受九折优惠。
发表评论