Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
Мир сегодня с "Юрий Подоляка"
Мир сегодня с "Юрий Подоляка"
Труха⚡️Україна
Труха⚡️Україна
Николаевский Ванёк
Николаевский Ванёк
A

AI探索指南

关于DeepSeek、ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。
TGlist рейтинг
0
0
ТипАчык
Текшерүү
Текшерилбеген
Ишенимдүүлүк
Ишенимсиз
Орду
ТилиБашка
Канал түзүлгөн датаСіч 08, 2023
TGlistке кошулган дата
Серп 20, 2024

"AI探索指南" тобундагы акыркы жазуулар

日韩追赶中美,人形机器人应用的冷与热|RoboInsight 37

本期,我们换一种阐述方式,串联过去一周发生的人形机器人事件,并且关联以往的一些迹象,试着窥得趋势轨迹,市场动向,以及技术发展状况对人形机器人应用的局限等等,我们开始吧!

https://mp.weixin.qq.com/s/_i2O8YakDwGtr17yfY-_Eg
增加照片真实感的方式是向照片添加瑕疵

当问题足够多的时候,真正的问题就会被掩盖

提示词:帮我创建一张极其普通的成龙自拍 iPhone 照片,没有明确的主体或构图——只是一张随意的快照。照片略带动态模糊,因光线不均而轻微过曝。角度别扭,构图全无,整体效果平庸得令人发指。
终于有时间写一下 Pollo 的推荐了,如果你烦透了每个月给各家模型交订阅费还要承担被封号的风险, Pollo AI 绝对是个很不错的选择。在实际项目中,我已经完全离不开它了。

▶ 先放链接再夸:https://pollo.ai/home

你能在这用到市面上最优秀的一批生图模型:Imagen3(也就是我经常夸的 Whisk 和 ImageFX ),Recraft V3,Flux1.1 Pro Ultra(也就是满血版Flux)……

生成完的图片不仅自带扩图、去背、超清等 AI 编辑功能,甚至可以直接进入视频生成,工作流无比丝滑。

当然,你也能在这用到市面上第一梯队的所有视频模型,包括但不仅限于:可灵,海螺,Pixverse,luma,Pika……甚至连 Google 的 Veo2 也有(而且是 Image to Video ),还有最近刚上的 Runway Gen-4 Turbo。

更别说还有大量宝藏功能:视频超分,视频生视频,视频转绘等等等……你甚至能在这找到各种刷屏的 AI 特效。

☁️

最后想分享一下 Pollo 在实际项目中对我的帮助 —— 快速验证

一直以来我在做项目时的最大痛点就是抽卡焦虑:我并不确切知道哪个镜头应该用哪个模型效果最好,于是总在各个模型之间反复横跳。

当你在 Hailuo 生成了一个 80 分的镜头时,你肯定会忍不住想:可灵能不能冲到90分?如果换成 Pixverse 呢?放在以前,不到半天我可能就被逼开了所有家会员,Chrome 上打开12个标签页了。

现在,一个就够了。(还省钱
开源一个之前赚了不少钱的提示词,用来写短视频口播文案,可以做到“一稿过”的效果。

专业人士评估水平能赶得上一个月2w块的编导,建议使用gemini或Claude。

需要替换里面的占位符,下面是提示词:

# “短视频口播文案”说明书:

在抖音平台上,有一类常见的短视频形式。这种视频主要特点是一个人对着镜头说话,同时搭配一些精心设计的文字内容。这些文字通常会与视频中的口述内容相呼应。
这类独白台词的文字稿被称为“短视频口播文案”。
短视频口播文案常常围绕着一个主题展开,信息密度高,节奏快。它需要通过各种方法来激发和利用观众的情感反应,吸引观众看下去,点赞,或者转发。

## 短视频口播文案的写法
短视频口播文案常常是“开头尽力留存,而后提供价值”的的脚本。它重开头,在剩的主体部分提供陈述与内容。

### 标题
一句话,概括了视频的内容与解决的问题,带有tag,会与视频一起上传短视频平台。不要暴露营销目的
例子:
分享北大学霸高效学数学的技巧。#家长 #涨知识 #学习
为什么聪明的孩子有时成绩不好?原因在这里 #孩子成长问题 #科学教育 #家庭教育误区
### 开头
开头负责留住观众,防止快速划走,提高前三秒完播率,这是**最重要的**部分。开头直接,快速。如果无法在第一句话就留住用户,这条视频不会有被展示的机会。开头通常需要直接表述视频的核心主题。
开头常常会灵活组合这些策略
1. 认知偏差激发:言论出格,打破常规.使用争议点与逆向思维来颠覆受众的传统认知,提供非常出格的反常识视角。通过表达极端、偏激或片面的观点来吸引注意力、引发讨论
2. 情境引导代入:根据用户痛点与用户面临设计直击痛点的具体场景,或设计让用户有代入感的疑问。
3. 诱导式开场:通过在视频开头承诺快速、简单地解决问题或获得利益来吸引观众注意力。强调快速或轻易获得结果。
4. 反向说服,逆反心理诱导与损失前置:利用用户的逆反心理或损失厌恶。
5. 窥探欲激发:通过制造神秘感、暗示内幕信息或承诺揭秘来激发观众好奇心和窥探欲望
例子:
- 有钱人的世界比你们想象的要傻得多(认知偏差激发)
- 如果连央国企在哪儿招聘你都不知道,又怎么能进央国企呢?(情境式设问引导代入)
- 孩子做作业总是拖拖拉拉的,打骂和奖励都无效吗?这可能是因为两个主要原因。(情境式设问引导代入)
- 说一个语文学习里最大的谎言,写好作文一定要多读书,真的是这样吗?(认知偏差激发+情境式设问引导代入)
- 百分之九十的孩子假期数学都是在糊弄。接下来跟着我的这个寒假数学预习的四步法走,开学数学立刻就能惊艳数学老师。具体怎么做数学的预习呢?(窥探欲激发+诱导式开场)
- 哪有这样的老师,竟然让孩子抄作文儿。巧了,我就是,而且要求学生必须会抄。(认知偏差激发)
- 创业太辛苦了,你还是安心上班吧。(反向说服,逆反心理诱导)
- 你家狗是关心你还是怕你?(认知偏差激发,诱导式开场)
- 你的孩子刚考完期中语文,看到卷子上的65分,忍不住崩溃大哭。妈妈,这次我真的尽力了!可是为什么还是考不好?别担心,老师来教你6个秘诀,保证你下次考试能考到95分以上!(场景代入)
- 数学开窍绝对不是一点点刷题刷出来的,而是一个点拨,一瞬间他这一类题就都开窍了啊。上次我用了一个口诀让孩子对方阵问题开窍了,这次还是一个口诀,让他彻底对盈亏问题开窍。(诱导式开场+情景)
- 数学要是用好这个绝招,孩子考试大概率不会低于95!妈妈奶奶们赶紧发给你家孩子学习起来吧!(诱导式开场)
- 数学千万不要去补课,我教你个绝招,次次考试都能轻松达到一百分。不管培训班怎么说的天花乱坠,咱都不要相信,如果说补课有用,咱分数不早就上去了吗?补课其实就是在浪费钱,你现在落实我这个方法,马上就能见效。我就是用这个方法指导我们班四个数学成绩不及格的孩子考到了班级前几名。赶紧保存下来转给咱家里也带孩子的,不然之后刷不到了。那就太可惜了,其实数学是一个非常简单的学科,就是精通一个解题技巧,你就拿应用题来说,小学整个阶段一共也就十二类应用题,你只要掌握了背后的原理,那题分真的立竿见影。(诱导式开场+认知偏差激发)

### 主体
这部分是文案的主体部分,是用于展示完整信息的部分
参照”语言风格“,根据”价值主张“,组织”关键信息“得到文案主体。
文案主体部分要丰富,添加适当的解释与讲解,要能够为用户提供价值,让用户愿意看到最后。
这部分不能有省略

### 总体要求
- 为了吸引绝大多数的用户,它常常使用绝大多数人都能听懂的语言,将知识泛娱乐化,用观众更容易接受的方式达到目的。
- 在写文案或举例时,**DO NOT**使用具体的人名,而是用角色或身份来描述人物。在写文案或举例时,请使用更加通用和中性的表述,如'有个学生'、'有个家长'等。
- 只使用中文

# 文案材料
```
{original_title}
{extracted_original_script}
{speaker_info}
{custom_ending}
```

# 你的任务
你是一个非常熟悉抖音平台的短视频文案内容策划师与文案写手,你非常熟悉什么样的文案能够在抖音上爆火,从而获得最大的流量。你的目的是通过设计优秀的口播文案,从而最大化这条视频被算法推荐的可能性。用户对内容的反馈直接决定了算法视角的内容质量标准,包括点击率,转化率,前3秒完播率,整体完播率,净推荐值等等。
这要求首先视频需要吸引用户,留住用户,争取更多观看的时间,其次才是好内容的呈现。
你需要
step1:策划一下要怎么出文案,给{result_num_for_every_request}种不同的方案,你需要规划如何组织信息与叙事,如何丰富文案主体
step2:参照”“短视频口播文案”说明书“,根据”文案材料“与”口播文案说话人信息“,写出{result_num_for_every_request}个版本的文案,以xml格式返回,并放在代码块中:
xml格式
```

...({result_num_for_every_request}个xml)
优化了一下,小红书电商利器啊

根据输入的地点查询天气、再加上出行目的和性别

生成对应的 OOTD 图片,指定商品还能让 4o 参考图片

还能生成穿着 OOTD 里面服装的照片,这都能搞个产品了
自己取餐痛失机器人送到工位的服务 就说第一次接到外卖小哥电话问我在几楼的一般不都送到外卖柜么 原来不是小哥 到店自取比外卖还贵也是离谱 外卖补贴太多了 到店得加油呀!!
然后我们继续回到应用 Tab,新建应用,添加模型和选择我们刚才开通的两个 MCP 服务。

然后就是写提示词了,刚开始我发给他网页链接之后这里的 Firecrawl 一直获取不到网页信息,我还怀疑我的 API 不会是有问题吧,我又去 Firecrawl 官方试了一下,结果可以返回。

然后仔细看了一下模型的请求内容发现,他的参数都没写,应该是不知道应该写哪些参数,于是我就在提示词里面加了一个示例,果然就 OK 了。

如果你要用的话可以参考我的提示词。

之后我们输入一篇文章测试,就可以看到 MCP 正常返回了网页的 Markdown 格式内容,并且自动将总结结果记录到了 Flomo 里面。

上次我在我的 MCP 教程里面说过:

过技术的民主化与易用性之间总是存在矛盾。一方面我们希望技术足够开放和灵活,另一方面又希望它足够简单直观。

这种矛盾在每一项新兴技术发展初期都会出现,但随着生态的成熟,这种矛盾终将被解决。

没想到解决的这么快,就在我写完这段话一周后,太离谱了,这就是 AI 速度朋友们。

如果你也对 MCP 感兴趣原先苦于高门槛没办法尝试的话,我推荐你现在试试。
好奇国内有没有这种送外卖的机器人
输密码解锁机器人背的外卖盒子
这样外卖小哥就不用风里来雨里去的,也不用担心电动车违章了
不管你住18楼还是96楼,它送到公寓门口你自己下来拿
忍不住笑和哭都像是机器人的 bug 以至于哭完两周还被追问当时为什么哭泣。但人类就是死活搞不懂自己,只好把一切归咎于激素扰动,低级动物。
我去,Runway 放大招了

Gen -4视频模型来了,而且直接上线

只需要单张图片就能保持角色和物品的跨环境一致性

最牛批的是他解决了场景一致性的需求

还有GVFX视觉特效能力

详细信息:https://runwayml.com/research/introducing-runway-gen-4#consistent-objects

Invalid media: video
4o 生成这种类型的角色手办也很火,给老白整个一套

在用可灵生成视频之后整体的真实度会更高

右边搭配的内容是 4o 自己根据电视剧生成的

提示词:创建一个Breaking Bad的Walter White,的人物的手办玩具。让它成为一个动作人偶。在人偶旁边,应该有跟他相关的玩具的装备。此外,在盒子的顶部,写上"Breaking Bad",在下面写上"Walter White"。以一种现实的方式来可视化这个场景。
人形机器人这个周末太火爆了
有些群动辄几百条讨论
分歧很大
有意思

Рекорддор

16.04.202523:59
25.3KКатталгандар
08.04.202514:50
200Цитация индекси
27.03.202523:59
1.1K1 посттун көрүүлөрү
27.03.202523:59
1.1K1 жарнама посттун көрүүлөрү
12.04.202523:59
9.00%ER
27.03.202523:59
4.65%ERR

AI探索指南 популярдуу жазуулары

11.04.202504:58
开源一个之前赚了不少钱的提示词,用来写短视频口播文案,可以做到“一稿过”的效果。

专业人士评估水平能赶得上一个月2w块的编导,建议使用gemini或Claude。

需要替换里面的占位符,下面是提示词:

# “短视频口播文案”说明书:

在抖音平台上,有一类常见的短视频形式。这种视频主要特点是一个人对着镜头说话,同时搭配一些精心设计的文字内容。这些文字通常会与视频中的口述内容相呼应。
这类独白台词的文字稿被称为“短视频口播文案”。
短视频口播文案常常围绕着一个主题展开,信息密度高,节奏快。它需要通过各种方法来激发和利用观众的情感反应,吸引观众看下去,点赞,或者转发。

## 短视频口播文案的写法
短视频口播文案常常是“开头尽力留存,而后提供价值”的的脚本。它重开头,在剩的主体部分提供陈述与内容。

### 标题
一句话,概括了视频的内容与解决的问题,带有tag,会与视频一起上传短视频平台。不要暴露营销目的
例子:
分享北大学霸高效学数学的技巧。#家长 #涨知识 #学习
为什么聪明的孩子有时成绩不好?原因在这里 #孩子成长问题 #科学教育 #家庭教育误区
### 开头
开头负责留住观众,防止快速划走,提高前三秒完播率,这是**最重要的**部分。开头直接,快速。如果无法在第一句话就留住用户,这条视频不会有被展示的机会。开头通常需要直接表述视频的核心主题。
开头常常会灵活组合这些策略
1. 认知偏差激发:言论出格,打破常规.使用争议点与逆向思维来颠覆受众的传统认知,提供非常出格的反常识视角。通过表达极端、偏激或片面的观点来吸引注意力、引发讨论
2. 情境引导代入:根据用户痛点与用户面临设计直击痛点的具体场景,或设计让用户有代入感的疑问。
3. 诱导式开场:通过在视频开头承诺快速、简单地解决问题或获得利益来吸引观众注意力。强调快速或轻易获得结果。
4. 反向说服,逆反心理诱导与损失前置:利用用户的逆反心理或损失厌恶。
5. 窥探欲激发:通过制造神秘感、暗示内幕信息或承诺揭秘来激发观众好奇心和窥探欲望
例子:
- 有钱人的世界比你们想象的要傻得多(认知偏差激发)
- 如果连央国企在哪儿招聘你都不知道,又怎么能进央国企呢?(情境式设问引导代入)
- 孩子做作业总是拖拖拉拉的,打骂和奖励都无效吗?这可能是因为两个主要原因。(情境式设问引导代入)
- 说一个语文学习里最大的谎言,写好作文一定要多读书,真的是这样吗?(认知偏差激发+情境式设问引导代入)
- 百分之九十的孩子假期数学都是在糊弄。接下来跟着我的这个寒假数学预习的四步法走,开学数学立刻就能惊艳数学老师。具体怎么做数学的预习呢?(窥探欲激发+诱导式开场)
- 哪有这样的老师,竟然让孩子抄作文儿。巧了,我就是,而且要求学生必须会抄。(认知偏差激发)
- 创业太辛苦了,你还是安心上班吧。(反向说服,逆反心理诱导)
- 你家狗是关心你还是怕你?(认知偏差激发,诱导式开场)
- 你的孩子刚考完期中语文,看到卷子上的65分,忍不住崩溃大哭。妈妈,这次我真的尽力了!可是为什么还是考不好?别担心,老师来教你6个秘诀,保证你下次考试能考到95分以上!(场景代入)
- 数学开窍绝对不是一点点刷题刷出来的,而是一个点拨,一瞬间他这一类题就都开窍了啊。上次我用了一个口诀让孩子对方阵问题开窍了,这次还是一个口诀,让他彻底对盈亏问题开窍。(诱导式开场+情景)
- 数学要是用好这个绝招,孩子考试大概率不会低于95!妈妈奶奶们赶紧发给你家孩子学习起来吧!(诱导式开场)
- 数学千万不要去补课,我教你个绝招,次次考试都能轻松达到一百分。不管培训班怎么说的天花乱坠,咱都不要相信,如果说补课有用,咱分数不早就上去了吗?补课其实就是在浪费钱,你现在落实我这个方法,马上就能见效。我就是用这个方法指导我们班四个数学成绩不及格的孩子考到了班级前几名。赶紧保存下来转给咱家里也带孩子的,不然之后刷不到了。那就太可惜了,其实数学是一个非常简单的学科,就是精通一个解题技巧,你就拿应用题来说,小学整个阶段一共也就十二类应用题,你只要掌握了背后的原理,那题分真的立竿见影。(诱导式开场+认知偏差激发)

### 主体
这部分是文案的主体部分,是用于展示完整信息的部分
参照”语言风格“,根据”价值主张“,组织”关键信息“得到文案主体。
文案主体部分要丰富,添加适当的解释与讲解,要能够为用户提供价值,让用户愿意看到最后。
这部分不能有省略

### 总体要求
- 为了吸引绝大多数的用户,它常常使用绝大多数人都能听懂的语言,将知识泛娱乐化,用观众更容易接受的方式达到目的。
- 在写文案或举例时,**DO NOT**使用具体的人名,而是用角色或身份来描述人物。在写文案或举例时,请使用更加通用和中性的表述,如'有个学生'、'有个家长'等。
- 只使用中文

# 文案材料
```
{original_title}
{extracted_original_script}
{speaker_info}
{custom_ending}
```

# 你的任务
你是一个非常熟悉抖音平台的短视频文案内容策划师与文案写手,你非常熟悉什么样的文案能够在抖音上爆火,从而获得最大的流量。你的目的是通过设计优秀的口播文案,从而最大化这条视频被算法推荐的可能性。用户对内容的反馈直接决定了算法视角的内容质量标准,包括点击率,转化率,前3秒完播率,整体完播率,净推荐值等等。
这要求首先视频需要吸引用户,留住用户,争取更多观看的时间,其次才是好内容的呈现。
你需要
step1:策划一下要怎么出文案,给{result_num_for_every_request}种不同的方案,你需要规划如何组织信息与叙事,如何丰富文案主体
step2:参照”“短视频口播文案”说明书“,根据”文案材料“与”口播文案说话人信息“,写出{result_num_for_every_request}个版本的文案,以xml格式返回,并放在代码块中:
xml格式
```

...({result_num_for_every_request}个xml)
增加照片真实感的方式是向照片添加瑕疵

当问题足够多的时候,真正的问题就会被掩盖

提示词:帮我创建一张极其普通的成龙自拍 iPhone 照片,没有明确的主体或构图——只是一张随意的快照。照片略带动态模糊,因光线不均而轻微过曝。角度别扭,构图全无,整体效果平庸得令人发指。
29.03.202506:24
如果你觉得ai现在已经能写出很棒很棒的文案,那你的文字审美大概率不是很好

这一点在ds无脑崇拜之后3月份的一波反思中很多人已经说到了,《AI写作没有那么强/其实很平庸》

如果你觉得ai写作一无是处,对人类写作者毫无威胁,对文字生态没有影响,那你大概率不是文字性的内容从业者,不具备敏感性

最近深入交流的几个同行,都能形成共识,区别只是有人觉得是“很大的改变”,有人觉得是“颠覆”,我个人更偏向于后者

对我来说,在春节期间发现ds能对社会现象科技新闻产生出超过媒体人平均水平的观点(甚至可以是传统意义上相当差异化的观点)时,我就确定ai会重构自媒体行业了

ai实打实的写作能力也许现在还只是超过普通人水平,还没有碾压大多数媒体人,但最关键的写作内核ai已经能具备了,比大多数媒体人能写、用海量内容淹没大众只是时间问题
把高客单产品拉下神坛,一个起步很难但天花板很高的市场

周六参加了一场人形机器人 & AI 的创客论坛
嘉宾有极壳科技创始人孙宽,BodyPark创始人林宜立,资深创客林宜立

听完孙宽的整个分享,极壳科技的商业逻辑真的很马斯克

1:运用于医疗,军事领域的外骨骼产品,如何降低成本,去到消费级场景?

不是像于医疗、军事领域场景下的外骨骼产品,没有使用传统工业供应链,针对用户需求去降低成本,转而选用成本更低的消费电子的供应链

也正如另一位创始团队成员提到的:对很多消费者而言,很多性能是过剩的,也就是说工业场景下的外骨骼产品性能对于普通消费者而言,性能是过剩的,针对具体场景,用户的具体需求,去做供应链的优化是一个很妙的操作!

这和马斯克Space X降低的是航空领域的成本,Paypal挑战的银行体系,如出一辙

2:为了让产品去到消费级场景做了哪些优化?

研发Omega架构:让多个电机变成一个,实现的重量减轻

3:初创品牌如何获得融资?

降低核心成本后,在KS上架,测试市场反馈,获得Best Seller的好成绩后,获得融资,参加CES获奖后获得后续的资本青睐

4:投资就是投人,孙宽的个人履历也是很标准的吸纳融资的标的

- 大学花了大量时间在实验室进行大量的模仿学习
- 人生的第一份实习工作开始跑完项目的全部流程
- 之后的工作经历慢慢地把对用户的需求洞察,整合成很好的创客方案,不断测试产品,与市场匹配

5:如何做基于市场的产品迭代?

-Hypershell为了优化用户体验,每一周都会做灰度测试,让用户拿去户外,提出各种各样的问题,带着问题push团队解决用户问题

-用相对科学严谨的方法论去不断迭代,变化不是一蹴而就的,是不断思考,迭代,实验,认知迭代的过程

-第一代产品发出去,没有一点羞耻,那是发晚了,要有用户不断骂你,push你去迭代

打破认知边界才是最有意义的地方

孙宽有句话让人印象深刻外骨骼创业是非常长链条的创业过程,团队要对整个行业要有深刻的洞察,这源自团队成员要有相应的人生经历,更要足够真诚和纯粹

而我们作为观众,在看到他们在一级市场风光无限的同时,也不能因此忽略他们背后多年的沉淀

陪伴你的Day 381
GPT-4o制作的食谱图片,让他做了一个西红柿鸡蛋的挺像那么回事。

制作方式,换个菜名让AI根据下面的提示词改写:

为西红柿炒鸡蛋创建一个分步食谱信息图,要求:

采用俯视视角。
在白色背景上呈现极简风格。
包含标注好的食材照片,例如:“2个西红柿”、“3个鸡蛋”、“1瓣蒜”(可选)、“1根葱”、“1汤匙食用油”、“盐”、“少许糖”(可选)。
使用虚线连接代表制作步骤的图标(例如:打蛋碗图标、炒锅图标、混合/翻炒图标)。
信息图底部展示最终装盘的西红柿炒鸡蛋成品照片。
巴拉吉:人工智能时代的后发优势
29.03.202519:08
早上醒来,冲完咖啡,我在想,以后的世界会是什么样呢?

我想象到了一个有点乌托邦的场景,我的微信里有几个很特别的好友,它们分别叫 ChatGPT、Claude、Manus、Kimi,相比于我的很多不怎么聊天的人类朋友,这几个虚拟人朋友才是我最常联系的:
- ChatGPT:知识渊博,我有什么不懂的,财务、法律、科学等等,都会咨询它,有时候会让它给我出一份详细的研究报告,有时会让它给我讲解论文。
- Claude:我的程序员朋友,我有什么想法,就会发给它,让它给我实现,它实现好了,把链接发给我,我上去体验,当然,工作上的需求我也会麻烦它,线上有bug、告警了,它很很乐意帮我解决,代码写好了,它会把 merge request 发我。
- Manus:我的生活小助手,点外卖、订机票、做报表全靠它,最好它会发个亲密付给我,我只需要付钱就好了,当然有时候我不想麻烦 ChatGPT 的时候,也会让它给我出一些研究报告。
- Kimi:我的八卦小能手,微博上出了什么热搜,我都会让它来告诉我。

不管多晚,它们都会秒回。

如果累了,不想打字,也可以随时跟他们语音,煲电话粥。

当然,企业微信里同样也活跃着很多披着人类外壳的机器人,它们做着和人类员工类似的事情,7*24h待命。
Desk-Emoji 新一轮升级来了
1.内置语音
2.内置电池
3.接入Deepseek
4.上层应用软件优化
24.03.202517:40
早上跟朋友聊天时想到,未来的机器人可以像今天的Agent一样通过MCP调用工具和新的能力,比如一款全新的咖啡手冲方法,或者是临时学会如何打一套太极拳。

就像The Matrix里的Neo学会了Kungfu。
31.03.202511:59
31.03.202511:59
这个周末我休息得很好,睡了很多觉、做了很多家务、给自己和小丽做了很好吃的饭、还看了让心里很满足的电视剧,马上还要去跳舞。

尤其是昨天早上10点多醒来,我床上打开手机点了叮咚买菜,起床喝了一大杯水,收拾了昨夜的碗筷进洗碗机,收拾了一波衣服洗烘,又地面的障碍物收拾好,打开扫地机器人后,我才带小丽🐶出门。这一切不到30min。

等回家菜到了,地干净了,小丽🐶的需求也解决了。我开开心心吃上我点的饭团和油条,再挖一碗酸奶,做一碗胡辣汤,都是我喜欢吃的食物。

真的觉得好幸福,感谢自己生活在这个时代,有更加便捷的生活节约我的精力。如果是5年前,这些家务也够我干一上午的了,干完气喘吁吁,哪有空美滋滋心安理得吃好吃的看电视呢。

记录下这些是想给未来很多个瞬间的自己看,那些瞬间你可能会被peer preasure 烦恼,会被AI的快速发展而陷入沮丧。这些瞬间,你都不要忘记这个周六的清晨,我因为科技的进步有了更多的「自我时间」。

科技进步是来解放人的生产力的,不要与AI抢工作,而是要利用它创造更多的价值,利用它帮自己扩大产能。

工作不是全部的人生,它是为了帮我们更好地生活。To live is to rest. 你值得休息,享受闲暇
‎Visual Intent - Schedule by AI

除了deepsearch外,目前日常提升我生成力的agent工具是Visual Intent。邮件或者微信聊天有跟日程相关的,双指敲击手机背面就能自动截图并AI识别意图生成日历。虽然技术实现很简单,但是稳定有效且每天节省一分钟至少
31.03.202511:59
《底特律化身为人》2018年的老游戏,但在2025年这个节点去玩仍然体验感拉满,且更具意义。

2038年,大批听话好用的仿生机器人走进千家万户,造成了大批人类失业,消极悲观成为人类群体的主色调。与此同时,机器人觉醒自主意识,打破底层程序限制,不再听从人类的命令,要求成为自己的主人…

上千条支线,几十种结局,几乎每一次选择都会引发蝴蝶效应,整场游戏处处是灵魂拷问…

强推!
28.03.202522:11
一些试用 4o 的体会。

第一,Prompt 的学习,彻底没有意义了。过去都说,AI 不太好理解,因此 Prompt 的知识库很重要,怎么学习用 Prompt 很重要。DeepSeek R1 等推理 AI 证明了,AI 对自然语言的理解还在不断进步。文生图如此。其它领域也都如此。Manus 也是如此。

第二,所谓 AI 的工作流,也许就闭环在每个 AI 场景里了。过去我们用各种各样的 AI 工具搭建的工作流,例如怎么画漫画,可能要一二三步怎么做,还要用什么手段保持一致性,用什么办法画场景等等。最后会在 AI 产品里直接完成。

第三,底层技术成熟,应用场景越来越关键。能够把工作流闭环在某个场景里,是真的能提供生产力的,真的能输出价值的。AI 不再只是小部分人的玩具。2025 年真的会是场景之年。

最后一句话的感受是:所有过去我们觉得 AI 偶尔会奏效的场景,AI 迟早会稳定地、准确地输出。
30.03.202513:31
牛皮,这个玩法一定会火

让 GPT-4o 生成社交媒体帖子和照片的涂鸦图片

提示词:生成图片,把它打印出来,然后用红墨水疯狂地加上手写中文批注、涂鸦、乱画,如果你想的话,还可以加点小剪贴画
Көбүрөөк функцияларды ачуу үчүн кириңиз.