Skip to content
/ MLLM Public

“一切结束之后,我学到了很多。过去的都过去了,至于现在......你知道,都没关系了!过去并不会真正逝去。我们虽无法预见,但未来总是建立在过去之上。而且,是时候试试新事物了。”

License

WAIIC/MLLM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

79 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

「灵晰」多模态AI机械臂

——以智能理解重写生产规则,你的全感知智能协作桌面助手

封面

项目介绍

本项目旨在基于进迭时空K1-RISC-V平台和大象机器人280RISC-V版本六轴机械臂,通过集成阿里云SegmentCommonImage算法、百度千帆的自动语音识别(ASR)系统以及大型语言模型(LLM)和多模态模型(VLM),打造一款桌面级的多模态AI机械臂。该机械臂的核心设计目标是实现环境感知、智能决策和实体交互能力的深度融合,从而能够理解并执行复杂的自然语言指令,完成一系列精细化的操作任务。具体而言,项目致力于构建一个从多模态信息输入(视觉、语音)到语义理解,再到任务规划与机械臂精准执行的完整闭环系统。项目的核心是要求机械臂能够“看得见”、“听得懂”,更要能够“思考”并“行动”,最终实现人机协作的智能化和自然化。通过这一设计,我们期望突破传统机械臂仅能执行预设程序的局限,赋予其更强的环境适应性和任务灵活性,为智能制造、智能服务等领域提供一种全新的、更具智能的解决方案。

开发硬件

机械臂:大象机器人Mycobot 280 RISCV

开发板:进迭时空K1 8核

复现注意

  • 考虑到Ubuntu限制了直接在系统环境中安装第三方库,因此你需要使用Pyenv进行开发环境隔离(Anaconda暂时没有发行RISCV版本)
  • 需要配置Python 3.12+及所需环境包(在Requirements.txt文件夹中)
  • 将API_KEY.py中的密钥和KEY换成你自己的,相关base_url和测试可用的模型已经填好
  • 请正确安装并检查外设(末端执行器、摄像头与麦克风等)

特别鸣谢

中科(梁溪)人工智能实验室

中科院半导体所 赵博士 林博士

江南大学 祖同学

大连海事大学 陆同学

进迭时空售后技术支持团队

About

“一切结束之后,我学到了很多。过去的都过去了,至于现在......你知道,都没关系了!过去并不会真正逝去。我们虽无法预见,但未来总是建立在过去之上。而且,是时候试试新事物了。”

Resources

License

Stars

Watchers

Forks

Contributors 2

  •  
  •  

Languages