摘录
发布于 , 最后编辑于示例
100个电影开场设计 20250116
Gemini 专访谷歌DeepMind CEO Demis Hassabis。 1214
模型接口使用量,openrouter平台的统计,网站。 1213
最近比较满意的一个转绘,终于用上自己的工作流了!(对,还是之前那个)
已经上传C站,随便下载随便玩。
苹果的统一内存真的能帮助本地化大模型吗?想买个 mac studio 来试试。但是木有钱哈哈。
同时想买 vision pro
理论上 vision pro 加上某些精细控制部分压力的触感手套,是不是就可以模拟到摸到任何东西?只要建立好视觉模型和触感反馈。
附图头号玩家。
![]()
触感手套 ![]()
vision pro 的物体建模 1114
想学习大语言模型(LLM),应该从哪个开源模型开始?
Base64编码有何用处?
1113
张铎。
被政委警告了,价值观不对,试用期要挂了[笑cry]所以有啥事都可以喷我,我来转达[允悲]//@Apache9:我这只管基建啊,买卡搭集群,架RDMA网络,训练和推理框架优化调度优化,Agent和RAG,只搞这些,大模型有专门的算法团队用我搭的集群训。小爱,手机AIOS,自动驾驶都是我的甲方,他们出问题了别喷我。被政委警告了,价值观不对,试用期要挂了[笑cry]所以有啥事都可以喷我,我来转达[允悲]。现在用什么卡做?这不能说,你懂的[doge]但反正国产卡我们也都在测了。了解了[doge]。小米成立AI平台部,恭喜铎神归位[哇]
分享一个在线电影拉片工具【Movieminer】:网页链接,目前收录了 1049 部电影、5 万多个镜头和 150 多万个截图。 网站提供“一键拉片”功能,可以直接从站内导入现有的电影资源进行在线拉片,导入后电影会被拆解为一个个连续的小镜头, 并附有镜头内容简介,可以勾选单个或多个镜头进行详细拉片。另外还有一个“搜索镜头”功能,可以按关键词搜索指定的场景、情节、角色、动作、表情等,对于找寻找绘画或设计参考来说非常方便。
Movie Screencap:网页链接,这个网站有很多不错的电影截图,色彩、构图都选的比较好。关键是,每一张截图的配色,它都会帮你列出来,还分不同色系。 1110
视频截取 GIF :potplayer > 视频 > 视频录制 > 录制视频 > 文件格式 GIF
品城记曾老板
国外开发者 Simon Willison 花一周时间用 Claude 的 Artifacts 功能,一口气做了14个小程序 source
昨晚一直在听一个播客《小心地滑》,然后还在即刻看了主播的一系列内容,感觉挺有意思的。 比较喜欢的几期,047、038、035、030。 即刻上也有有意思的内容,像 The Last of Us,去香港看奥本海默,很熟悉的感觉,还有很多和播客相关的东西。 不过有一种感觉,自己对特别深入的概念没啥想法,想轻松一点。
想提升英文水平到可以听英文播客和看英文影视不用字幕的程度。
后来听新一期播客,感觉跑调好像对日语也挺熟悉。难道她是中日英三语熟练听说选手?!很羡慕这些懂几种语言的人!!虽然现在可能实时同传得 AI 工具可能已经有了,但是人配备这种自然的技能还是很厉害的!!想变成这样的人!!先从提升英语听说读写熟练度开始吧!!
“我喜欢人类。”
对人形机器人的偏爱,受「星球大战」影响很深,而且相信AI在个性上的细微瑕疵,会让它变得足够特别,每个人都拥有一个不可思议的同伴,不是全知全能的那种,而是带有和每个人相处之后形成的不完美,比如为了一些蠢问题互相争论,就像R2-D2、C-3PO那样。 希望年轻人过上「有用的生活」,对环境的净贡献大于净消费,坚持大量读书,扩大兴趣边界,不然你可能到死都不知道自己真正对什么感兴趣,多阅读,多尝试,多和不同于自己的人交往,直到发现和你的才能相匹配的事业,然后,干就完事儿了。 source1、source2 1020
金价持续涨。
《深入理解Linux内核》,内存分配,内存管理,编译链接。source
当某个产品正好符合了市场的需求,并且能够被市场消费,那是Product-Market Fit(PMF) PMF
“我认为我的一大优势是,我期望值很低。我认为大多数斯坦福毕业生期望值很高。 期望值很高的人通常韧性很低。不幸的是,韧性在成功中很重要。我不知道如何教你们,除了我希望痛苦发生在你们身上。” 黄仁勋 黄仁勋
Corner Case是指罕见但可能导致危险的异常情况。
守破离
讲道理,有了这些设备,什么都可以造出来了吧。具体有哪些设备可以列个单。 1014
分享 GitHub 上一份收录独立开发/出海开发相关技术栈及工具。awesome-indie-hacker-tools
分享一份整理了颇多关于 DevOps 的学习资源列表:DevOps-Guide。DevOps-Guide
GitHubDaily 2023 年在微博所分享的开源项目。GitHubDaily
Hinton 家族图谱
#情绪价值 #大学生就业指南 #新需求 Doge source
Levels.fyi 开发了一个可交互式的薪资热力图,点击进入某个地区,就可以了解该地主要公司的薪资百分位数、总薪酬组成部分的详细信息以及公司薪酬排序介绍等内容。你还可以点击公司的详细页面,查看该公司内部的职级分布和对应的薪水等更加详细的内容(图2)。该热力图对不同行政区域用虚线进行了分割。source
感觉这个项目很有意思,对好食项目有参考价值,首先把数据收集起来,然后可视化展示,以后的更多想做的东西都可以放在上面。 1010
很喜欢的一套星际穿越的海报,通过 reddit 和 amazon 找到相对比较清晰的图片。画师是 Kevin Dart。reddit、imdb、amazon1、x、imgur、ins。 1008
对信息要敏感,要抓住、理解重要信息,虽然往往是后来才知道这是一个重要的信息,但是要尽力去抓到很多信息,然后理解信息,然后知道现在世界在什么状态。最近的牛市,和错过 18 号 E 大的消费车有感,感觉 E 的很多微博和公众号内容还没有理解透。18 号发车+致敬信号、涨起来之后关于踏空的分享、18号买入后的分享。 1008
用被动收入作为日常开销,用工作收入作为投资增值,这个想法还是第一次听说,不过感觉也挺有意思的。source、source。 1008
“如果我们用工作来支付生活,用投资来致富,那么我们每年可以花的钱就是 6 万,没有上涨的空间。虽然投资会增值,但我们还是讨厌工作,还是会焦虑失业,还是会痛苦工资怎么还不涨……但如果反过来呢,我有一笔 60 万的投资,每年从里面支取 10% 的收益来支付生活。然后我工作赚的钱全都用来投资,通过工作而不是投资来让本金增值。”
“而改变还远远不止生活,还有我们对工作的态度:当我们用工作支付生活,用投资复利来增值时,工作的动机是「维持」收入。我们会觉得自己是在被迫工作。如果收入不增加,我们会对工作充满怨气,但为生活所迫又不敢停下。而当我们用被动收入支付生活,用工作来增值呢?工作的动机变成了「提升」收入。不工作不会影响生活,而工作却能让收入越来越高。我们更容易从工作中获得价值感,会更加享受工作的过程,因为这是我们自己的选择。”
学习如何获取稳定的被动收入,是必要的,但从工作中获取收入去填充投资池子,是年轻时候更为重要的,因为本金小的时候,10w翻倍,也只是10w,而工作上努力升职,可能每年都能多收10w。
但学习通过被动收入去获得自由,这路上的一些想法,也能帮助改善或塑造自己的生活观念。也大公众号里面还是有很多有价值的内容的。
像现在我的思考和要做的一件事是,计算出目前,我的一年必需开销是多少,在保证基本生活和基本娱乐的情况下。然后是如何自由职业获取一份收入,这是更为重要的,解决这个问题,无限游戏就能继续了。另外是安全垫、保险的问题。
基于CNN卷积神经网络的验证码识别由Hsury提供,source:JiJiDown的鸣谢页面。 1008
Firecrawl 能够抓取任何网站的所有可访问子页面,无需站点地图。收费项目,非开源。项目地址、source。 1007
误区定式,误区,用未知的信息,去计算达成目标的困难,定式,将行动局限在想象之中。结构化拆解问题的能力,问题拆解,消除未知,成本风险,步骤分解。结构化拆解问题,通过信息进行成本风险的测算,然后分步执行。source。 1007
宵宫声音模型,GPT-SoVITS,项目地址。 1007
词曲版权,录音版权。歌曲的界面可以看到 OP(Original Publisher 原版权管理方)和 SP(Sub Publisher 代理版权公司)。苏打绿为什么要重录专辑?一个视频让你搞懂音乐版权。
从小学时候就开始听苏打绿,后面开始听其他的歌之后就听得比较少了,但现在一听还是很喜欢,词曲旋律。
《空气中的视听与幻觉》,挺有意思的歌词。
《无与伦比的美丽》,写给安溥的歌,写给挚友的作品,“嘿 你知道当你需要个夏天我会拼了命努力 嘿 我知道你会做我的掩护 当我是个逃兵”。想到安溥在凭借《最好的时光》拿到金曲奖年度歌曲的时候在颁奖典礼上那个和青峰的拥抱。
“相信简单但深刻的情感可以流传。” 至于最终得主为安溥《最好的时光》,陈建骐也解释了评选过程以及思考此奖项的脉络,「年度歌曲在金曲奖的选择标准中,有一个是高传唱度,入围作品中,周杰伦的《最伟大的作品》是传唱度最高的,但大家也可能忽略了,年度歌曲的另外一个条件,要有一个时代意义,或者是对于现在的处境,有一些观察或描写。」《最好的时光》是一首纪录女孩至女人的岁月心得。陈建骐进一步解释:「我们评审团,都觉得现在这个状态,尤其是疫情过后,其实有很多的时候,我们希望可以透过音乐得到一些温暖,或是问一些自己的问题——我们该如何自处在现在这个环境,现在也有好多的不确定,或是近期社会的风风雨雨,安溥的《最好的时光》都在问每一个人,自己的问题,或许大家听了这首歌之后,可以自己给自己一些答案,然后可以让我们,好好的过日子。
音乐的分类,可以有多少个维度呢? 1007
AI 语音技术01:走进语音技术的世界。 1007
“LLM还是被低估了。之前更多的是看到潜力,但这两月我第一次感觉离真正的的可用是如此之近,是的我感受到了”。 1005
“很多人以了解大模型细节以及各种推倒甚至记住他们而感到开心。这容易本末倒置,所谓的细节和推倒都只为了让你对大模型的理解更加深刻,这种深刻应该是一种通透但不模糊的,是一种像焦距可以随时调整细节或者全局的。然而,像上面深入理解大模型还不是终态,因为这些终究是知识而已,只是在AI时代是最廉价的,因为AI更擅长。终态是你对这些理解并不在意,因为他就像日常使用筷子一样是自然而然,并且你在其上衍生新的创新点,无论是对模型自身,还是基于大模型的应用,你常常能看到一些别人看不到的点”。
畅想未来AI社会。 1005
樋口爱这巨人三连太好听太喜欢了,这两天在一直听,太喜欢 11:20 的那一段钢琴了。樋口爱演唱会上海站 巨人三重奏 。 1004
OpenAI 开源了 whisper-large-v3-turbo 的模型,语音识别。
OpenAI 新的写作、编程协作工具 GPT-4o Canvas 这个来自开发团队的演示更全,其设计理念:“我心目中的终极AGI界面是一张空白画布。它能够随着人类的偏好不断演变、自我变形,并发明出与人类互动的全新方式,重新定义我们与AI技术以及整个互联网的关系。” 完整提示词,以及如何破解
特斯拉10月10号 robotaxi 的发布会,可能会有很多内容,不过离车真正上路,博主预期还要3-5年。特斯拉去年收购了一家无线充电技术公司 Wiferion。这个自动驾驶视频,在开头左转也停了挺久的,很多人说路况不够复杂,但是人家美国就是这样的路况,他们能通过这样的方案把人从驾驶中抽离出来,满足他们的要求就好了,我们的路况复杂,但是如果技术没到那种程度,那就是还是一直人开车。华为 ADS3.0 怎么样,好像挺好的,期待推广。特斯拉用纯视觉方案也有道理,“道路环境本身就是为视觉设计的,更别提摄像头的感知比人眼强多了。视觉方案能用上多年来大量积攒的数据,目前的算力和算法并不支持很好的处理视觉、雷达等多种信息融合”,能地图规划个大概路线,端到端的系统具体到每个路段细节的驾驶,就已经很好了。另外要看一下安德烈之前在特斯拉搞了啥,他那一个李飞飞的大弟子,有图像识别相关的研究基础,又有超大数据集的基因,肯定有搞了很多推进。赛博皮卡全自动驾驶 FSD V12.5.5,Wiferion 。 1004
Cursor没有帮我解决的问题,logger 使用,问题是没有添加流式输出,
ch = logging.StreamHandler()
,导致logger一直没有输出。参考1 ,参考2 。 1003
吴教授畅想了AI在教育中的诸多应用,如AI导师等创新概念。他认为,教育领域即将迎来一场巨大的变革,尽管目前还难以准确预测其具体形态。吴教授呼吁教育机构应该调整教学方式,使之与未来技术发展保持一致。这不仅适用于计算机科学,也涵盖了化学工程、医学等其他领域。他认为,这对学术机构来说是一个巨大的挑战,但同时也是一个机遇。特别是在编程方面,吴教授希望借助编程助手和生成式AI的力量,使编程学习变得前所未有的容易,从而让更多人能够掌握这项技能。他观察到,会写一点代码的人现在比以往任何时候都更有价值,无论是软件工程师还是其他领域的专业人士。[source]https://mp.weixin.qq.com/s/DnWLhy1IOspQPvRe4nlatg
TreeSize Free ,好用的硬盘空间分析软件。 20241002
小米IoT开发者平台、XiaoAi 。 20241001
1.大模型各行业只做知识库、问答没有用,要深入行业内部,摸通行业内部的信息流动,对应执行智能化操作,类似 Agent 的感觉。但是感觉还是要从一个更高维度,去看大模型的这些功能与行业结合,能怎么增效。
2.钉钉 To B 在行业中有很大前景,深入办公,拥有客户的数据,更方便探索。
3.各行业要先理清公司本身内部的数据信息整理,需求文档整理,代码版本仓管理,等等。
4.安全性,这个很复杂,留给大公司去做吧。做一些创意类的总结,信息的归纳,教育教材的创新,原理的总结整理,风险会不那么大。
5.3到5年,推荐方向。具身智能;行业优秀高质量的数据集,与行业特征和数据的积累有关;个人助理、数字员工,减轻机械重复工作,每周工作四天,“把人之所以为人的这些思考和创造性可以发挥到更大,人的才华的巨大的解放。”;文本语音视觉自然融合的多模态大模型,能达到普通人水平;跨领域,大模型功能,与组织管理、组织行为网络、组织效率和创新力去结合;数字人成为组织里面的一个核心的组成部分,数字人和物理人形成开发灵活的工作生态。
外滩大会2024圆桌讨论。 20240930
NotebookLM 可能触及一个全新的领域,个人理解是针对每个人的个性化定制信息处理输入流。我也有点这种感觉,有可能。source1 ,source2 ,source3 。
CSS 在文字链接悬停时显示图片。 20240929
企业微信新向服务商开放会话内容存档三方接口。微信企业号的功能开发。几种协议:windows hook 协议,iPad 协议,微信网页协议。source 。
Ilya 2018 年在 MIT 的 讲座 让人收获不少,提及了强化学习 RL ,元学习(没太理解),自我对弈 Self-Play,如今 Self-Play 在 O1 模型上可能有了一定的使用,用来提升推理能力。看到其中提到通过 Self-Play 用 5 个月左右成为 Dota 世界冠军的例子,感觉这样的模型一旦开始运作,超越人类是指日可待,但就看能在哪些领域中实现超越。而且 Ilya 的语气让我感觉他是非常确信会有超越人类的计算机系统出现的,只是时间问题,而我现在也相信在两年或五年内会有大突破,会有大改变,现在就在保证当下的基本生活的情况下,多考虑怎么连接上那个即将到来的将来吧。另外算力和能源可能是一个限制,看到 OpenAI 准备搞芯片的消息,应该就是为了突破这层做准备吧,找一天了解训练能耗,模型价格,现在各家的显卡拥有量。
人社部公布 19 个 新增职业 ,后面找一天研究各种类型的职业。
推理意味着慢思考,区别于快思考马上给出答案,在得出结果之前要先自我反思质疑。“啊哈”时刻,就是那种灵光一现顿悟的时刻,突然发生了意想不到的突破, 让一切突然变得明了。source。
E 大经常说让有钱人把钱花出去,所以有什么是有钱人会花钱购买的产品。
汉语新解 解析 。 20240912
可以了解 prompt 方法、有趣的应用、Claude 能力似乎很强,引申为什么 Claude 会这么强(文学、代码)。
大模型对话集合网站 poe 。
查询飞行航班网站 flightradar24 。
Nvidia CEO 黄仁勋在 2024 年 2 月 13 号左右的 WORLD GOVERNMENTS SUMMIT 世界政府峰会对话阿联酋 AI 国务部长中 提到 (视频 19:05) ,不需要再学习编程(语言)了,因为编程语言已经逐渐变成自然语言了(慢慢可以通过自然语言去编程),这其中的技术间隙已经慢慢被填平,每个人都可以是程序员。他建议去学习生命科学,研究人体,蛋白质之类的。
我感觉确实一些编程很深度的技术细节可能不用太去深究了,而应该理解编程思想、精髓,了解产品怎么为人所用,为人服务。最近看了下 cursor,感觉已经挺有那种自然语言编程的样子了,后面回来使用下,有见到一个 使用案例,他做的视频内容搜索工具也是我比较 感兴趣 的哈哈。
cursor 官网提供了一个 视频教程。
内网穿透不安全,“任何时候都不应该把局域网服务穿透到公网上去,即便设置了强密码,也不能把带锁的卫生间门当防盗门用。 老老实实地去部署wireguard或者zerotier”。source。
内网穿透工具 ngrok ,之前搞 local LLM 搞过,现在不确定有没有关掉。。。应该关掉了吧。关掉方法:管理员模式打开powershell,'choco uninstall ngrok',卸载 ngrok。 20240911
暴力 AI 主机。主要是拉起 4 块 NVIDIA Tesla P100 16G 显卡,凑起 64G 显存,去跑 70B 参数的大模型,达到一个还可以的反应速度(13.1tokens/s)。跑 70B 模型需要大概 40G 显存。引申:功耗问题。英伟达显卡年鉴。source
发现了一本看起来好像挺好玩的书,小狗疑心大宇宙阴谋篡夺它的位置。 20240910

0day 服务器,看起来好像是个资源站,人人影视最开始获取最新资源的地方,顺着搜索到了 topsite。source:人人影视的 B 站视频。
markdown 超链接在新窗口打开的方式:<a href = "网址" target="_blank">描述</a>。source:CSDN。 20240908
字幕生成 Video Subtitle Generator。字幕提取 Video Subtitle Extractor。字幕去除 Video Subtitle Remover。