A
AI探索指南
关于DeepSeek、ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。
TGlist рейтинг
0
0
ТипАчык
Текшерүү
ТекшерилбегенИшенимдүүлүк
ИшенимсизОрду
ТилиБашка
Канал түзүлгөн датаСіч 08, 2023
TGlistке кошулган дата
Серп 20, 2024"AI探索指南" тобундагы акыркы жазуулар
16.04.202509:57
日韩追赶中美,人形机器人应用的冷与热|RoboInsight 37
本期,我们换一种阐述方式,串联过去一周发生的人形机器人事件,并且关联以往的一些迹象,试着窥得趋势轨迹,市场动向,以及技术发展状况对人形机器人应用的局限等等,我们开始吧!
https://mp.weixin.qq.com/s/_i2O8YakDwGtr17yfY-_Eg
本期,我们换一种阐述方式,串联过去一周发生的人形机器人事件,并且关联以往的一些迹象,试着窥得趋势轨迹,市场动向,以及技术发展状况对人形机器人应用的局限等等,我们开始吧!
https://mp.weixin.qq.com/s/_i2O8YakDwGtr17yfY-_Eg


14.04.202520:08
增加照片真实感的方式是向照片添加瑕疵
当问题足够多的时候,真正的问题就会被掩盖
提示词:帮我创建一张极其普通的成龙自拍 iPhone 照片,没有明确的主体或构图——只是一张随意的快照。照片略带动态模糊,因光线不均而轻微过曝。角度别扭,构图全无,整体效果平庸得令人发指。
当问题足够多的时候,真正的问题就会被掩盖
提示词:帮我创建一张极其普通的成龙自拍 iPhone 照片,没有明确的主体或构图——只是一张随意的快照。照片略带动态模糊,因光线不均而轻微过曝。角度别扭,构图全无,整体效果平庸得令人发指。


14.04.202512:30
14.04.202512:30
14.04.202512:30
14.04.202512:30
终于有时间写一下 Pollo 的推荐了,如果你烦透了每个月给各家模型交订阅费还要承担被封号的风险, Pollo AI 绝对是个很不错的选择。在实际项目中,我已经完全离不开它了。
▶ 先放链接再夸:https://pollo.ai/home
你能在这用到市面上最优秀的一批生图模型:Imagen3(也就是我经常夸的 Whisk 和 ImageFX ),Recraft V3,Flux1.1 Pro Ultra(也就是满血版Flux)……
生成完的图片不仅自带扩图、去背、超清等 AI 编辑功能,甚至可以直接进入视频生成,工作流无比丝滑。
当然,你也能在这用到市面上第一梯队的所有视频模型,包括但不仅限于:可灵,海螺,Pixverse,luma,Pika……甚至连 Google 的 Veo2 也有(而且是 Image to Video ),还有最近刚上的 Runway Gen-4 Turbo。
更别说还有大量宝藏功能:视频超分,视频生视频,视频转绘等等等……你甚至能在这找到各种刷屏的 AI 特效。
☁️
最后想分享一下 Pollo 在实际项目中对我的帮助 —— 快速验证
一直以来我在做项目时的最大痛点就是抽卡焦虑:我并不确切知道哪个镜头应该用哪个模型效果最好,于是总在各个模型之间反复横跳。
当你在 Hailuo 生成了一个 80 分的镜头时,你肯定会忍不住想:可灵能不能冲到90分?如果换成 Pixverse 呢?放在以前,不到半天我可能就被逼开了所有家会员,Chrome 上打开12个标签页了。
现在,一个就够了。(还省钱
▶ 先放链接再夸:https://pollo.ai/home
你能在这用到市面上最优秀的一批生图模型:Imagen3(也就是我经常夸的 Whisk 和 ImageFX ),Recraft V3,Flux1.1 Pro Ultra(也就是满血版Flux)……
生成完的图片不仅自带扩图、去背、超清等 AI 编辑功能,甚至可以直接进入视频生成,工作流无比丝滑。
当然,你也能在这用到市面上第一梯队的所有视频模型,包括但不仅限于:可灵,海螺,Pixverse,luma,Pika……甚至连 Google 的 Veo2 也有(而且是 Image to Video ),还有最近刚上的 Runway Gen-4 Turbo。
更别说还有大量宝藏功能:视频超分,视频生视频,视频转绘等等等……你甚至能在这找到各种刷屏的 AI 特效。
☁️
最后想分享一下 Pollo 在实际项目中对我的帮助 —— 快速验证
一直以来我在做项目时的最大痛点就是抽卡焦虑:我并不确切知道哪个镜头应该用哪个模型效果最好,于是总在各个模型之间反复横跳。
当你在 Hailuo 生成了一个 80 分的镜头时,你肯定会忍不住想:可灵能不能冲到90分?如果换成 Pixverse 呢?放在以前,不到半天我可能就被逼开了所有家会员,Chrome 上打开12个标签页了。
现在,一个就够了。(还省钱
11.04.202504:58
开源一个之前赚了不少钱的提示词,用来写短视频口播文案,可以做到“一稿过”的效果。
专业人士评估水平能赶得上一个月2w块的编导,建议使用gemini或Claude。
需要替换里面的占位符,下面是提示词:
# “短视频口播文案”说明书:
在抖音平台上,有一类常见的短视频形式。这种视频主要特点是一个人对着镜头说话,同时搭配一些精心设计的文字内容。这些文字通常会与视频中的口述内容相呼应。
这类独白台词的文字稿被称为“短视频口播文案”。
短视频口播文案常常围绕着一个主题展开,信息密度高,节奏快。它需要通过各种方法来激发和利用观众的情感反应,吸引观众看下去,点赞,或者转发。
## 短视频口播文案的写法
短视频口播文案常常是“开头尽力留存,而后提供价值”的的脚本。它重开头,在剩的主体部分提供陈述与内容。
### 标题
一句话,概括了视频的内容与解决的问题,带有tag,会与视频一起上传短视频平台。不要暴露营销目的
例子:
分享北大学霸高效学数学的技巧。#家长 #涨知识 #学习
为什么聪明的孩子有时成绩不好?原因在这里 #孩子成长问题 #科学教育 #家庭教育误区
### 开头
开头负责留住观众,防止快速划走,提高前三秒完播率,这是**最重要的**部分。开头直接,快速。如果无法在第一句话就留住用户,这条视频不会有被展示的机会。开头通常需要直接表述视频的核心主题。
开头常常会灵活组合这些策略
1. 认知偏差激发:言论出格,打破常规.使用争议点与逆向思维来颠覆受众的传统认知,提供非常出格的反常识视角。通过表达极端、偏激或片面的观点来吸引注意力、引发讨论
2. 情境引导代入:根据用户痛点与用户面临设计直击痛点的具体场景,或设计让用户有代入感的疑问。
3. 诱导式开场:通过在视频开头承诺快速、简单地解决问题或获得利益来吸引观众注意力。强调快速或轻易获得结果。
4. 反向说服,逆反心理诱导与损失前置:利用用户的逆反心理或损失厌恶。
5. 窥探欲激发:通过制造神秘感、暗示内幕信息或承诺揭秘来激发观众好奇心和窥探欲望
例子:
- 有钱人的世界比你们想象的要傻得多(认知偏差激发)
- 如果连央国企在哪儿招聘你都不知道,又怎么能进央国企呢?(情境式设问引导代入)
- 孩子做作业总是拖拖拉拉的,打骂和奖励都无效吗?这可能是因为两个主要原因。(情境式设问引导代入)
- 说一个语文学习里最大的谎言,写好作文一定要多读书,真的是这样吗?(认知偏差激发+情境式设问引导代入)
- 百分之九十的孩子假期数学都是在糊弄。接下来跟着我的这个寒假数学预习的四步法走,开学数学立刻就能惊艳数学老师。具体怎么做数学的预习呢?(窥探欲激发+诱导式开场)
- 哪有这样的老师,竟然让孩子抄作文儿。巧了,我就是,而且要求学生必须会抄。(认知偏差激发)
- 创业太辛苦了,你还是安心上班吧。(反向说服,逆反心理诱导)
- 你家狗是关心你还是怕你?(认知偏差激发,诱导式开场)
- 你的孩子刚考完期中语文,看到卷子上的65分,忍不住崩溃大哭。妈妈,这次我真的尽力了!可是为什么还是考不好?别担心,老师来教你6个秘诀,保证你下次考试能考到95分以上!(场景代入)
- 数学开窍绝对不是一点点刷题刷出来的,而是一个点拨,一瞬间他这一类题就都开窍了啊。上次我用了一个口诀让孩子对方阵问题开窍了,这次还是一个口诀,让他彻底对盈亏问题开窍。(诱导式开场+情景)
- 数学要是用好这个绝招,孩子考试大概率不会低于95!妈妈奶奶们赶紧发给你家孩子学习起来吧!(诱导式开场)
- 数学千万不要去补课,我教你个绝招,次次考试都能轻松达到一百分。不管培训班怎么说的天花乱坠,咱都不要相信,如果说补课有用,咱分数不早就上去了吗?补课其实就是在浪费钱,你现在落实我这个方法,马上就能见效。我就是用这个方法指导我们班四个数学成绩不及格的孩子考到了班级前几名。赶紧保存下来转给咱家里也带孩子的,不然之后刷不到了。那就太可惜了,其实数学是一个非常简单的学科,就是精通一个解题技巧,你就拿应用题来说,小学整个阶段一共也就十二类应用题,你只要掌握了背后的原理,那题分真的立竿见影。(诱导式开场+认知偏差激发)
### 主体
这部分是文案的主体部分,是用于展示完整信息的部分
参照”语言风格“,根据”价值主张“,组织”关键信息“得到文案主体。
文案主体部分要丰富,添加适当的解释与讲解,要能够为用户提供价值,让用户愿意看到最后。
这部分不能有省略
### 总体要求
- 为了吸引绝大多数的用户,它常常使用绝大多数人都能听懂的语言,将知识泛娱乐化,用观众更容易接受的方式达到目的。
- 在写文案或举例时,**DO NOT**使用具体的人名,而是用角色或身份来描述人物。在写文案或举例时,请使用更加通用和中性的表述,如'有个学生'、'有个家长'等。
- 只使用中文
# 文案材料
```
{original_title}
{extracted_original_script}
{speaker_info}
{custom_ending}
```
# 你的任务
你是一个非常熟悉抖音平台的短视频文案内容策划师与文案写手,你非常熟悉什么样的文案能够在抖音上爆火,从而获得最大的流量。你的目的是通过设计优秀的口播文案,从而最大化这条视频被算法推荐的可能性。用户对内容的反馈直接决定了算法视角的内容质量标准,包括点击率,转化率,前3秒完播率,整体完播率,净推荐值等等。
这要求首先视频需要吸引用户,留住用户,争取更多观看的时间,其次才是好内容的呈现。
你需要
step1:策划一下要怎么出文案,给{result_num_for_every_request}种不同的方案,你需要规划如何组织信息与叙事,如何丰富文案主体
step2:参照”“短视频口播文案”说明书“,根据”文案材料“与”口播文案说话人信息“,写出{result_num_for_every_request}个版本的文案,以xml格式返回,并放在代码块中:
xml格式
```
...({result_num_for_every_request}个xml)
专业人士评估水平能赶得上一个月2w块的编导,建议使用gemini或Claude。
需要替换里面的占位符,下面是提示词:
# “短视频口播文案”说明书:
在抖音平台上,有一类常见的短视频形式。这种视频主要特点是一个人对着镜头说话,同时搭配一些精心设计的文字内容。这些文字通常会与视频中的口述内容相呼应。
这类独白台词的文字稿被称为“短视频口播文案”。
短视频口播文案常常围绕着一个主题展开,信息密度高,节奏快。它需要通过各种方法来激发和利用观众的情感反应,吸引观众看下去,点赞,或者转发。
## 短视频口播文案的写法
短视频口播文案常常是“开头尽力留存,而后提供价值”的的脚本。它重开头,在剩的主体部分提供陈述与内容。
### 标题
一句话,概括了视频的内容与解决的问题,带有tag,会与视频一起上传短视频平台。不要暴露营销目的
例子:
分享北大学霸高效学数学的技巧。#家长 #涨知识 #学习
为什么聪明的孩子有时成绩不好?原因在这里 #孩子成长问题 #科学教育 #家庭教育误区
### 开头
开头负责留住观众,防止快速划走,提高前三秒完播率,这是**最重要的**部分。开头直接,快速。如果无法在第一句话就留住用户,这条视频不会有被展示的机会。开头通常需要直接表述视频的核心主题。
开头常常会灵活组合这些策略
1. 认知偏差激发:言论出格,打破常规.使用争议点与逆向思维来颠覆受众的传统认知,提供非常出格的反常识视角。通过表达极端、偏激或片面的观点来吸引注意力、引发讨论
2. 情境引导代入:根据用户痛点与用户面临设计直击痛点的具体场景,或设计让用户有代入感的疑问。
3. 诱导式开场:通过在视频开头承诺快速、简单地解决问题或获得利益来吸引观众注意力。强调快速或轻易获得结果。
4. 反向说服,逆反心理诱导与损失前置:利用用户的逆反心理或损失厌恶。
5. 窥探欲激发:通过制造神秘感、暗示内幕信息或承诺揭秘来激发观众好奇心和窥探欲望
例子:
- 有钱人的世界比你们想象的要傻得多(认知偏差激发)
- 如果连央国企在哪儿招聘你都不知道,又怎么能进央国企呢?(情境式设问引导代入)
- 孩子做作业总是拖拖拉拉的,打骂和奖励都无效吗?这可能是因为两个主要原因。(情境式设问引导代入)
- 说一个语文学习里最大的谎言,写好作文一定要多读书,真的是这样吗?(认知偏差激发+情境式设问引导代入)
- 百分之九十的孩子假期数学都是在糊弄。接下来跟着我的这个寒假数学预习的四步法走,开学数学立刻就能惊艳数学老师。具体怎么做数学的预习呢?(窥探欲激发+诱导式开场)
- 哪有这样的老师,竟然让孩子抄作文儿。巧了,我就是,而且要求学生必须会抄。(认知偏差激发)
- 创业太辛苦了,你还是安心上班吧。(反向说服,逆反心理诱导)
- 你家狗是关心你还是怕你?(认知偏差激发,诱导式开场)
- 你的孩子刚考完期中语文,看到卷子上的65分,忍不住崩溃大哭。妈妈,这次我真的尽力了!可是为什么还是考不好?别担心,老师来教你6个秘诀,保证你下次考试能考到95分以上!(场景代入)
- 数学开窍绝对不是一点点刷题刷出来的,而是一个点拨,一瞬间他这一类题就都开窍了啊。上次我用了一个口诀让孩子对方阵问题开窍了,这次还是一个口诀,让他彻底对盈亏问题开窍。(诱导式开场+情景)
- 数学要是用好这个绝招,孩子考试大概率不会低于95!妈妈奶奶们赶紧发给你家孩子学习起来吧!(诱导式开场)
- 数学千万不要去补课,我教你个绝招,次次考试都能轻松达到一百分。不管培训班怎么说的天花乱坠,咱都不要相信,如果说补课有用,咱分数不早就上去了吗?补课其实就是在浪费钱,你现在落实我这个方法,马上就能见效。我就是用这个方法指导我们班四个数学成绩不及格的孩子考到了班级前几名。赶紧保存下来转给咱家里也带孩子的,不然之后刷不到了。那就太可惜了,其实数学是一个非常简单的学科,就是精通一个解题技巧,你就拿应用题来说,小学整个阶段一共也就十二类应用题,你只要掌握了背后的原理,那题分真的立竿见影。(诱导式开场+认知偏差激发)
### 主体
这部分是文案的主体部分,是用于展示完整信息的部分
参照”语言风格“,根据”价值主张“,组织”关键信息“得到文案主体。
文案主体部分要丰富,添加适当的解释与讲解,要能够为用户提供价值,让用户愿意看到最后。
这部分不能有省略
### 总体要求
- 为了吸引绝大多数的用户,它常常使用绝大多数人都能听懂的语言,将知识泛娱乐化,用观众更容易接受的方式达到目的。
- 在写文案或举例时,**DO NOT**使用具体的人名,而是用角色或身份来描述人物。在写文案或举例时,请使用更加通用和中性的表述,如'有个学生'、'有个家长'等。
- 只使用中文
# 文案材料
```
{original_title}
{extracted_original_script}
{speaker_info}
{custom_ending}
```
# 你的任务
你是一个非常熟悉抖音平台的短视频文案内容策划师与文案写手,你非常熟悉什么样的文案能够在抖音上爆火,从而获得最大的流量。你的目的是通过设计优秀的口播文案,从而最大化这条视频被算法推荐的可能性。用户对内容的反馈直接决定了算法视角的内容质量标准,包括点击率,转化率,前3秒完播率,整体完播率,净推荐值等等。
这要求首先视频需要吸引用户,留住用户,争取更多观看的时间,其次才是好内容的呈现。
你需要
step1:策划一下要怎么出文案,给{result_num_for_every_request}种不同的方案,你需要规划如何组织信息与叙事,如何丰富文案主体
step2:参照”“短视频口播文案”说明书“,根据”文案材料“与”口播文案说话人信息“,写出{result_num_for_every_request}个版本的文案,以xml格式返回,并放在代码块中:
xml格式
```
...({result_num_for_every_request}个xml)
11.04.202503:14
优化了一下,小红书电商利器啊
根据输入的地点查询天气、再加上出行目的和性别
生成对应的 OOTD 图片,指定商品还能让 4o 参考图片
还能生成穿着 OOTD 里面服装的照片,这都能搞个产品了
根据输入的地点查询天气、再加上出行目的和性别
生成对应的 OOTD 图片,指定商品还能让 4o 参考图片
还能生成穿着 OOTD 里面服装的照片,这都能搞个产品了
10.04.202511:24
自己取餐痛失机器人送到工位的服务 就说第一次接到外卖小哥电话问我在几楼的一般不都送到外卖柜么 原来不是小哥 到店自取比外卖还贵也是离谱 外卖补贴太多了 到店得加油呀!!


09.04.202513:28
然后我们继续回到应用 Tab,新建应用,添加模型和选择我们刚才开通的两个 MCP 服务。
然后就是写提示词了,刚开始我发给他网页链接之后这里的 Firecrawl 一直获取不到网页信息,我还怀疑我的 API 不会是有问题吧,我又去 Firecrawl 官方试了一下,结果可以返回。
然后仔细看了一下模型的请求内容发现,他的参数都没写,应该是不知道应该写哪些参数,于是我就在提示词里面加了一个示例,果然就 OK 了。
如果你要用的话可以参考我的提示词。
之后我们输入一篇文章测试,就可以看到 MCP 正常返回了网页的 Markdown 格式内容,并且自动将总结结果记录到了 Flomo 里面。
上次我在我的 MCP 教程里面说过:
过技术的民主化与易用性之间总是存在矛盾。一方面我们希望技术足够开放和灵活,另一方面又希望它足够简单直观。
这种矛盾在每一项新兴技术发展初期都会出现,但随着生态的成熟,这种矛盾终将被解决。
没想到解决的这么快,就在我写完这段话一周后,太离谱了,这就是 AI 速度朋友们。
如果你也对 MCP 感兴趣原先苦于高门槛没办法尝试的话,我推荐你现在试试。
然后就是写提示词了,刚开始我发给他网页链接之后这里的 Firecrawl 一直获取不到网页信息,我还怀疑我的 API 不会是有问题吧,我又去 Firecrawl 官方试了一下,结果可以返回。
然后仔细看了一下模型的请求内容发现,他的参数都没写,应该是不知道应该写哪些参数,于是我就在提示词里面加了一个示例,果然就 OK 了。
如果你要用的话可以参考我的提示词。
之后我们输入一篇文章测试,就可以看到 MCP 正常返回了网页的 Markdown 格式内容,并且自动将总结结果记录到了 Flomo 里面。
上次我在我的 MCP 教程里面说过:
过技术的民主化与易用性之间总是存在矛盾。一方面我们希望技术足够开放和灵活,另一方面又希望它足够简单直观。
这种矛盾在每一项新兴技术发展初期都会出现,但随着生态的成熟,这种矛盾终将被解决。
没想到解决的这么快,就在我写完这段话一周后,太离谱了,这就是 AI 速度朋友们。
如果你也对 MCP 感兴趣原先苦于高门槛没办法尝试的话,我推荐你现在试试。
09.04.202503:28
好奇国内有没有这种送外卖的机器人
输密码解锁机器人背的外卖盒子
这样外卖小哥就不用风里来雨里去的,也不用担心电动车违章了
不管你住18楼还是96楼,它送到公寓门口你自己下来拿
输密码解锁机器人背的外卖盒子
这样外卖小哥就不用风里来雨里去的,也不用担心电动车违章了
不管你住18楼还是96楼,它送到公寓门口你自己下来拿


31.03.202518:50
忍不住笑和哭都像是机器人的 bug 以至于哭完两周还被追问当时为什么哭泣。但人类就是死活搞不懂自己,只好把一切归咎于激素扰动,低级动物。
31.03.202518:38
我去,Runway 放大招了
Gen -4视频模型来了,而且直接上线
只需要单张图片就能保持角色和物品的跨环境一致性
最牛批的是他解决了场景一致性的需求
还有GVFX视觉特效能力
详细信息:https://runwayml.com/research/introducing-runway-gen-4#consistent-objects
Invalid media: video
Gen -4视频模型来了,而且直接上线
只需要单张图片就能保持角色和物品的跨环境一致性
最牛批的是他解决了场景一致性的需求
还有GVFX视觉特效能力
详细信息:https://runwayml.com/research/introducing-runway-gen-4#consistent-objects
Invalid media: video
31.03.202518:38
4o 生成这种类型的角色手办也很火,给老白整个一套
在用可灵生成视频之后整体的真实度会更高
右边搭配的内容是 4o 自己根据电视剧生成的
提示词:创建一个Breaking Bad的Walter White,的人物的手办玩具。让它成为一个动作人偶。在人偶旁边,应该有跟他相关的玩具的装备。此外,在盒子的顶部,写上"Breaking Bad",在下面写上"Walter White"。以一种现实的方式来可视化这个场景。
在用可灵生成视频之后整体的真实度会更高
右边搭配的内容是 4o 自己根据电视剧生成的
提示词:创建一个Breaking Bad的Walter White,的人物的手办玩具。让它成为一个动作人偶。在人偶旁边,应该有跟他相关的玩具的装备。此外,在盒子的顶部,写上"Breaking Bad",在下面写上"Walter White"。以一种现实的方式来可视化这个场景。
31.03.202511:59
人形机器人这个周末太火爆了
有些群动辄几百条讨论
分歧很大
有意思
有些群动辄几百条讨论
分歧很大
有意思
Рекорддор
16.04.202523:59
25.3KКатталгандар08.04.202514:50
200Цитация индекси27.03.202523:59
1.1K1 посттун көрүүлөрү27.03.202523:59
1.1K1 жарнама посттун көрүүлөрү12.04.202523:59
9.00%ER27.03.202523:59
4.65%ERRКөбүрөөк функцияларды ачуу үчүн кириңиз.