摘录

发布于 2024.08.30 , 最后编辑于 2024.09.29

示例

100个电影开场设计 20250116

HA,如何看待米家官方开源了接入Home Assistant 的集成组件？ 1218

Gemini 专访谷歌DeepMind CEO Demis Hassabis。 1214

模型接口使用量，openrouter平台的统计，网站。 1213

油画AI绘图

最近比较满意的一个转绘，终于用上自己的工作流了！（对，还是之前那个）

已经上传C站，随便下载随便玩。

作品登上东京的大屏啦！！

苹果的统一内存真的能帮助本地化大模型吗？想买个 mac studio 来试试。但是木有钱哈哈。

100B以内开源大模型个人可用了。

同时想买 vision pro

理论上 vision pro 加上某些精细控制部分压力的触感手套，是不是就可以模拟到摸到任何东西？只要建立好视觉模型和触感反馈。

附图头号玩家。

触感手套

vision pro 的物体建模

1114

想学习大语言模型(LLM)，应该从哪个开源模型开始？

知乎问答

博客

知乎问答

这个图画得好好看

看图学

看图学

Base64编码有何用处?

知乎问答

1113

独家专访李子柒：归来依旧热爱

张铎。

小米成立AI平台部，任命张铎为AI平台负责人

被政委警告了，价值观不对，试用期要挂了[笑cry]所以有啥事都可以喷我，我来转达[允悲]//@Apache9:我这只管基建啊，买卡搭集群，架RDMA网络，训练和推理框架优化调度优化，Agent和RAG，只搞这些，大模型有专门的算法团队用我搭的集群训。小爱，手机AIOS，自动驾驶都是我的甲方，他们出问题了别喷我。被政委警告了，价值观不对，试用期要挂了[笑cry]所以有啥事都可以喷我，我来转达[允悲]。现在用什么卡做？这不能说，你懂的[doge]但反正国产卡我们也都在测了。了解了[doge]。小米成立AI平台部，恭喜铎神归位[哇]

被政委警告了，价值观不对，试用期要挂了[笑cry]

喜欢写代码、讨厌内卷：一个37岁中年程序员的开源故事

关于离职的一些复盘

分享一个在线电影拉片工具【Movieminer】：网页链接，目前收录了 1049 部电影、5 万多个镜头和 150 多万个截图。网站提供“一键拉片”功能，可以直接从站内导入现有的电影资源进行在线拉片，导入后电影会被拆解为一个个连续的小镜头，并附有镜头内容简介，可以勾选单个或多个镜头进行详细拉片。另外还有一个“搜索镜头”功能，可以按关键词搜索指定的场景、情节、角色、动作、表情等，对于找寻找绘画或设计参考来说非常方便。

Movie Screencap：网页链接，这个网站有很多不错的电影截图，色彩、构图都选的比较好。关键是，每一张截图的配色，它都会帮你列出来，还分不同色系。 1110

视频截取 GIF ：potplayer > 视频 > 视频录制 > 录制视频 > 文件格式 GIF

在线GIF切割、在线MP4转GIF、 GIF 压缩，使用 Microsoft Clipchamp
1101

品城记曾老板

深势科技

国外开发者 Simon Willison 花一周时间用 Claude 的 Artifacts 功能，一口气做了14个小程序 source

AI手机，干掉App？

昨晚一直在听一个播客《小心地滑》，然后还在即刻看了主播的一系列内容，感觉挺有意思的。比较喜欢的几期，047、038、035、030。即刻上也有有意思的内容，像 The Last of Us，去香港看奥本海默，很熟悉的感觉，还有很多和播客相关的东西。不过有一种感觉，自己对特别深入的概念没啥想法，想轻松一点。

想提升英文水平到可以听英文播客和看英文影视不用字幕的程度。

后来听新一期播客，感觉跑调好像对日语也挺熟悉。难道她是中日英三语熟练听说选手？！很羡慕这些懂几种语言的人！！虽然现在可能实时同传得 AI 工具可能已经有了，但是人配备这种自然的技能还是很厉害的！！想变成这样的人！！先从提升英语听说读写熟练度开始吧！！

“我喜欢人类。”

对人形机器人的偏爱，受「星球大战」影响很深，而且相信AI在个性上的细微瑕疵，会让它变得足够特别，每个人都拥有一个不可思议的同伴，不是全知全能的那种，而是带有和每个人相处之后形成的不完美，比如为了一些蠢问题互相争论，就像R2-D2、C-3PO那样。希望年轻人过上「有用的生活」，对环境的净贡献大于净消费，坚持大量读书，扩大兴趣边界，不然你可能到死都不知道自己真正对什么感兴趣，多阅读，多尝试，多和不同于自己的人交往，直到发现和你的才能相匹配的事业，然后，干就完事儿了。 source1、source2 1020

金价持续涨。

ADHD source1、source2 1019

《深入理解Linux内核》，内存分配，内存管理，编译链接。source

当某个产品正好符合了市场的需求，并且能够被市场消费，那是Product-Market Fit（PMF） PMF

“我认为我的一大优势是，我期望值很低。我认为大多数斯坦福毕业生期望值很高。期望值很高的人通常韧性很低。不幸的是，韧性在成功中很重要。我不知道如何教你们，除了我希望痛苦发生在你们身上。” 黄仁勋黄仁勋

Corner Case是指罕见但可能导致危险的异常情况。

守破离

source1 source2

太爽了，想要。电子工作间、木工坊

讲道理，有了这些设备，什么都可以造出来了吧。具体有哪些设备可以列个单。 1014

分享 GitHub 上一份收录独立开发/出海开发相关技术栈及工具。awesome-indie-hacker-tools

分享一份整理了颇多关于 DevOps 的学习资源列表：DevOps-Guide。DevOps-Guide

GitHubDaily 2023 年在微博所分享的开源项目。GitHubDaily

Hinton 家族图谱

#情绪价值 #大学生就业指南 #新需求 Doge source

Levels.fyi 开发了一个可交互式的薪资热力图，点击进入某个地区，就可以了解该地主要公司的薪资百分位数、总薪酬组成部分的详细信息以及公司薪酬排序介绍等内容。你还可以点击公司的详细页面，查看该公司内部的职级分布和对应的薪水等更加详细的内容（图2）。该热力图对不同行政区域用虚线进行了分割。source

感觉这个项目很有意思，对好食项目有参考价值，首先把数据收集起来，然后可视化展示，以后的更多想做的东西都可以放在上面。 1010

很喜欢的一套星际穿越的海报，通过 reddit 和 amazon 找到相对比较清晰的图片。画师是 Kevin Dart。reddit、imdb、amazon1、x、imgur、ins。 1008

对信息要敏感，要抓住、理解重要信息，虽然往往是后来才知道这是一个重要的信息，但是要尽力去抓到很多信息，然后理解信息，然后知道现在世界在什么状态。最近的牛市，和错过 18 号 E 大的消费车有感，感觉 E 的很多微博和公众号内容还没有理解透。18 号发车+致敬信号、涨起来之后关于踏空的分享、18号买入后的分享。 1008

用被动收入作为日常开销，用工作收入作为投资增值，这个想法还是第一次听说，不过感觉也挺有意思的。source、source。 1008

“如果我们用工作来支付生活，用投资来致富，那么我们每年可以花的钱就是 6 万，没有上涨的空间。虽然投资会增值，但我们还是讨厌工作，还是会焦虑失业，还是会痛苦工资怎么还不涨……但如果反过来呢，我有一笔 60 万的投资，每年从里面支取 10% 的收益来支付生活。然后我工作赚的钱全都用来投资，通过工作而不是投资来让本金增值。”

“而改变还远远不止生活，还有我们对工作的态度：当我们用工作支付生活，用投资复利来增值时，工作的动机是「维持」收入。我们会觉得自己是在被迫工作。如果收入不增加，我们会对工作充满怨气，但为生活所迫又不敢停下。而当我们用被动收入支付生活，用工作来增值呢？工作的动机变成了「提升」收入。不工作不会影响生活，而工作却能让收入越来越高。我们更容易从工作中获得价值感，会更加享受工作的过程，因为这是我们自己的选择。”

学习如何获取稳定的被动收入，是必要的，但从工作中获取收入去填充投资池子，是年轻时候更为重要的，因为本金小的时候，10w翻倍，也只是10w，而工作上努力升职，可能每年都能多收10w。

但学习通过被动收入去获得自由，这路上的一些想法，也能帮助改善或塑造自己的生活观念。也大公众号里面还是有很多有价值的内容的。

像现在我的思考和要做的一件事是，计算出目前，我的一年必需开销是多少，在保证基本生活和基本娱乐的情况下。然后是如何自由职业获取一份收入，这是更为重要的，解决这个问题，无限游戏就能继续了。另外是安全垫、保险的问题。

基于CNN卷积神经网络的验证码识别由Hsury提供，source：JiJiDown的鸣谢页面。 1008

Firecrawl 能够抓取任何网站的所有可访问子页面，无需站点地图。收费项目，非开源。项目地址、source。 1007

误区定式，误区，用未知的信息，去计算达成目标的困难，定式，将行动局限在想象之中。结构化拆解问题的能力，问题拆解，消除未知，成本风险，步骤分解。结构化拆解问题，通过信息进行成本风险的测算，然后分步执行。source。 1007

宵宫声音模型，GPT-SoVITS，项目地址。 1007

词曲版权，录音版权。歌曲的界面可以看到 OP（Original Publisher 原版权管理方）和 SP（Sub Publisher 代理版权公司）。苏打绿为什么要重录专辑？一个视频让你搞懂音乐版权。

从小学时候就开始听苏打绿，后面开始听其他的歌之后就听得比较少了，但现在一听还是很喜欢，词曲旋律。

《空气中的视听与幻觉》，挺有意思的歌词。

《无与伦比的美丽》，写给安溥的歌，写给挚友的作品，“嘿你知道当你需要个夏天我会拼了命努力嘿我知道你会做我的掩护当我是个逃兵”。想到安溥在凭借《最好的时光》拿到金曲奖年度歌曲的时候在颁奖典礼上那个和青峰的拥抱。

“相信简单但深刻的情感可以流传。” 至于最终得主为安溥《最好的时光》，陈建骐也解释了评选过程以及思考此奖项的脉络，「年度歌曲在金曲奖的选择标准中，有一个是高传唱度，入围作品中，周杰伦的《最伟大的作品》是传唱度最高的，但大家也可能忽略了，年度歌曲的另外一个条件，要有一个时代意义，或者是对于现在的处境，有一些观察或描写。」《最好的时光》是一首纪录女孩至女人的岁月心得。陈建骐进一步解释：「我们评审团，都觉得现在这个状态，尤其是疫情过后，其实有很多的时候，我们希望可以透过音乐得到一些温暖，或是问一些自己的问题——我们该如何自处在现在这个环境，现在也有好多的不确定，或是近期社会的风风雨雨，安溥的《最好的时光》都在问每一个人，自己的问题，或许大家听了这首歌之后，可以自己给自己一些答案，然后可以让我们，好好的过日子。

音乐的分类，可以有多少个维度呢？ 1007

AI 语音技术01：走进语音技术的世界。 1007

“LLM还是被低估了。之前更多的是看到潜力，但这两月我第一次感觉离真正的的可用是如此之近，是的我感受到了”。 1005

“很多人以了解大模型细节以及各种推倒甚至记住他们而感到开心。这容易本末倒置，所谓的细节和推倒都只为了让你对大模型的理解更加深刻，这种深刻应该是一种通透但不模糊的，是一种像焦距可以随时调整细节或者全局的。然而，像上面深入理解大模型还不是终态，因为这些终究是知识而已，只是在AI时代是最廉价的，因为AI更擅长。终态是你对这些理解并不在意，因为他就像日常使用筷子一样是自然而然，并且你在其上衍生新的创新点，无论是对模型自身，还是基于大模型的应用，你常常能看到一些别人看不到的点”。

畅想未来AI社会。 1005

樋口爱这巨人三连太好听太喜欢了，这两天在一直听，太喜欢 11：20 的那一段钢琴了。樋口爱演唱会上海站巨人三重奏。 1004

OpenAI 开源了 whisper-large-v3-turbo 的模型，语音识别。

OpenAI 新的写作、编程协作工具 GPT-4o Canvas 这个来自开发团队的演示更全，其设计理念：“我心目中的终极AGI界面是一张空白画布。它能够随着人类的偏好不断演变、自我变形，并发明出与人类互动的全新方式，重新定义我们与AI技术以及整个互联网的关系。” 完整提示词，以及如何破解

特斯拉10月10号 robotaxi 的发布会，可能会有很多内容，不过离车真正上路，博主预期还要3-5年。特斯拉去年收购了一家无线充电技术公司 Wiferion。这个自动驾驶视频，在开头左转也停了挺久的，很多人说路况不够复杂，但是人家美国就是这样的路况，他们能通过这样的方案把人从驾驶中抽离出来，满足他们的要求就好了，我们的路况复杂，但是如果技术没到那种程度，那就是还是一直人开车。华为 ADS3.0 怎么样，好像挺好的，期待推广。特斯拉用纯视觉方案也有道理，“道路环境本身就是为视觉设计的，更别提摄像头的感知比人眼强多了。视觉方案能用上多年来大量积攒的数据，目前的算力和算法并不支持很好的处理视觉、雷达等多种信息融合”，能地图规划个大概路线，端到端的系统具体到每个路段细节的驾驶，就已经很好了。另外要看一下安德烈之前在特斯拉搞了啥，他那一个李飞飞的大弟子，有图像识别相关的研究基础，又有超大数据集的基因，肯定有搞了很多推进。赛博皮卡全自动驾驶 FSD V12.5.5，Wiferion 。 1004

Cursor没有帮我解决的问题，logger 使用，问题是没有添加流式输出，ch = logging.StreamHandler()，导致logger一直没有输出。参考1 ，参考2 。 1003

吴教授畅想了AI在教育中的诸多应用，如AI导师等创新概念。他认为，教育领域即将迎来一场巨大的变革，尽管目前还难以准确预测其具体形态。吴教授呼吁教育机构应该调整教学方式，使之与未来技术发展保持一致。这不仅适用于计算机科学，也涵盖了化学工程、医学等其他领域。他认为，这对学术机构来说是一个巨大的挑战，但同时也是一个机遇。特别是在编程方面，吴教授希望借助编程助手和生成式AI的力量，使编程学习变得前所未有的容易，从而让更多人能够掌握这项技能。他观察到，会写一点代码的人现在比以往任何时候都更有价值，无论是软件工程师还是其他领域的专业人士。[source]https://mp.weixin.qq.com/s/DnWLhy1IOspQPvRe4nlatg

TreeSize Free ，好用的硬盘空间分析软件。 20241002

小米IoT开发者平台、XiaoAi 。 20241001

1.大模型各行业只做知识库、问答没有用，要深入行业内部，摸通行业内部的信息流动，对应执行智能化操作，类似 Agent 的感觉。但是感觉还是要从一个更高维度，去看大模型的这些功能与行业结合，能怎么增效。

2.钉钉 To B 在行业中有很大前景，深入办公，拥有客户的数据，更方便探索。

3.各行业要先理清公司本身内部的数据信息整理，需求文档整理，代码版本仓管理，等等。

4.安全性，这个很复杂，留给大公司去做吧。做一些创意类的总结，信息的归纳，教育教材的创新，原理的总结整理，风险会不那么大。

5.3到5年，推荐方向。具身智能；行业优秀高质量的数据集，与行业特征和数据的积累有关；个人助理、数字员工，减轻机械重复工作，每周工作四天，“把人之所以为人的这些思考和创造性可以发挥到更大，人的才华的巨大的解放。”；文本语音视觉自然融合的多模态大模型，能达到普通人水平；跨领域，大模型功能，与组织管理、组织行为网络、组织效率和创新力去结合；数字人成为组织里面的一个核心的组成部分，数字人和物理人形成开发灵活的工作生态。

外滩大会2024圆桌讨论。 20240930

NotebookLM 可能触及一个全新的领域，个人理解是针对每个人的个性化定制信息处理输入流。我也有点这种感觉，有可能。source1 ，source2 ，source3 。

CSS 在文字链接悬停时显示图片。 20240929

企业微信新向服务商开放会话内容存档三方接口。微信企业号的功能开发。几种协议：windows hook 协议，iPad 协议，微信网页协议。source 。

看 Ilya 的访谈之后重新翻看了下李飞飞自传《我看见的世界》，摘录了下，记录了下感想。 20240914

Ilya 2018 年在 MIT 的讲座让人收获不少，提及了强化学习 RL ，元学习（没太理解），自我对弈 Self-Play，如今 Self-Play 在 O1 模型上可能有了一定的使用，用来提升推理能力。看到其中提到通过 Self-Play 用 5 个月左右成为 Dota 世界冠军的例子，感觉这样的模型一旦开始运作，超越人类是指日可待，但就看能在哪些领域中实现超越。而且 Ilya 的语气让我感觉他是非常确信会有超越人类的计算机系统出现的，只是时间问题，而我现在也相信在两年或五年内会有大突破，会有大改变，现在就在保证当下的基本生活的情况下，多考虑怎么连接上那个即将到来的将来吧。另外算力和能源可能是一个限制，看到 OpenAI 准备搞芯片的消息，应该就是为了突破这层做准备吧，找一天了解训练能耗，模型价格，现在各家的显卡拥有量。

人社部公布 19 个新增职业，后面找一天研究各种类型的职业。

推理意味着慢思考，区别于快思考马上给出答案，在得出结果之前要先自我反思质疑。“啊哈”时刻，就是那种灵光一现顿悟的时刻，突然发生了意想不到的突破，让一切突然变得明了。source。

E 大经常说让有钱人把钱花出去，所以有什么是有钱人会花钱购买的产品。

汉语新解解析。 20240912

可以了解 prompt 方法、有趣的应用、Claude 能力似乎很强，引申为什么 Claude 会这么强（文学、代码）。

大模型对话集合网站 poe 。

查询飞行航班网站 flightradar24 。

Nvidia CEO 黄仁勋在 2024 年 2 月 13 号左右的 WORLD GOVERNMENTS SUMMIT 世界政府峰会对话阿联酋 AI 国务部长中提到 (视频 19：05) ，不需要再学习编程（语言）了，因为编程语言已经逐渐变成自然语言了（慢慢可以通过自然语言去编程），这其中的技术间隙已经慢慢被填平，每个人都可以是程序员。他建议去学习生命科学，研究人体，蛋白质之类的。

我感觉确实一些编程很深度的技术细节可能不用太去深究了，而应该理解编程思想、精髓，了解产品怎么为人所用，为人服务。最近看了下 cursor，感觉已经挺有那种自然语言编程的样子了，后面回来使用下，有见到一个使用案例，他做的视频内容搜索工具也是我比较感兴趣的哈哈。

专注图解计算机基础。

cursor 官网提供了一个视频教程。

内网穿透不安全，“任何时候都不应该把局域网服务穿透到公网上去，即便设置了强密码，也不能把带锁的卫生间门当防盗门用。老老实实地去部署wireguard或者zerotier”。source。

内网穿透工具 ngrok ，之前搞 local LLM 搞过，现在不确定有没有关掉。。。应该关掉了吧。关掉方法：管理员模式打开powershell，'choco uninstall ngrok'，卸载 ngrok。 20240911

暴力 AI 主机。主要是拉起 4 块 NVIDIA Tesla P100 16G 显卡，凑起 64G 显存，去跑 70B 参数的大模型，达到一个还可以的反应速度（13.1tokens/s）。跑 70B 模型需要大概 40G 显存。引申：功耗问题。英伟达显卡年鉴。source

发现了一本看起来好像挺好玩的书，小狗疑心大宇宙阴谋篡夺它的位置。 20240910

0day 服务器，看起来好像是个资源站，人人影视最开始获取最新资源的地方，顺着搜索到了 topsite。source：人人影视的 B 站视频。

markdown 超链接在新窗口打开的方式：<a href = "网址" target="_blank">描述</a>。source：CSDN。 20240908

字幕生成 Video Subtitle Generator。字幕提取 Video Subtitle Extractor。字幕去除 Video Subtitle Remover。

死亡搁浅剧情分析，分析1，分析2。 20240716

点击查看全部摘录