大番薯项目
发布于目前进度
- 接入通义千问联网API,实现命令行对话。
- 连通 GPT-SoVITS 实现声音克隆,将对话读出来。 20240930
- 搞个界面,显示对话,并方便后续加功能。 1003
- ...
规划功能
- 将大模型本地化。
- 麦克风语音输入,对话。
- 对话记录保存文档(或许接入 notion)。
- 文章存档。
- 大番薯操作电脑,下载视频。
- RSS 订阅指定网站的信息,每日输出总结。20240930
- ...
存在问题
- 大模型的能力支持到哪种程度了?
- 对电脑手机的操作能力怎么样,是否可行,准确度怎么样?
- 有什么现成好用的工具可以用上?
- 类似功能的软件有哪些?现状怎么样?
- 使用体验怎么优化?20240930
- ...
相关资料
OpenAI奥特曼:明年模型的关键词是代理,十年内实现无限上下文。
代理。奥特曼认为2025是代理年,o1则是一个重要起点。(这个和谷歌前CEO施密特一个看法,也把代理放在相当高的优先级)
代理如何融入OpenAI的长期计划?O1模型及其所有前身将成为真正实现代理的关键。
"人们很快就会适应任何新技术,但这个(代理)将是一件大事。"
"人们会要求代理完成原本需要一个月的任务,而它只需要一小时。然后他们会有10倍的代理,接着是1000倍的代理。"
代理控制你的电脑的障碍是什么?安全性和对齐问题。
找出AI今天能做到但还不能完全做到的边界是最佳切入点。因为当新模型出现时,你将成为首选。
随着我们进入代理的世界,OpenAI将尝试虚拟员工。
"这些例子展示的是我如何实际利用大型语言模型(LLMs)的。它们并不旨在炫耀技术的惊人能力,而是基于我解决工作需求的实际情况。" source
NotebookLM 可能触及一个全新的领域,个人理解是针对每个人的个性化定制信息处理输入流。我也有点这种感觉,有可能。source1 ,source2 ,source3 。
有一种强烈的感觉,以后应该会有一些类似个人助理的东西被每个人所用,也就是大番薯或者说像钢铁侠的贾维斯,反正就是一个人工智能助理。
接收个人比较感兴趣、会用上的信息,然后去定制化处理,或者说按照指定的命令去执行对应的操作。开始会接入本地的一个大模型,然后它可以使用各种工具去连接上网或是执行类似人类的操作。
例如看到一个项目的代码,就去分析这个项目的来龙去脉,后面做针对性功能添加或维护的时候,可以接入像 claude 的那种比较聪明的大模型去实现。
抑或是完成收集指定主题相关的信息,收集一个美食栏目的所有视频内容,然后观看,提取信息。
2024-09-29 19:27:41
项目介绍
大番薯,定位是作为个人助理,帮助我完成一些事情。也是借这个项目去学习、串联和练习一些技术,例如 LLM、AI Agent、RAG、TTS、RSS、图像识别算法、知识库、程序操纵电脑手机等。另外,有种强烈的预感。
感觉最好的方向还是一个助手,帮助记忆的助手,处理简单事务的助手,拓展人类能力边界的助手,监听 RSS 更新的助手,处理重复确定性任务的助手。
2024-09-19 18:01:12