本项目旨在基于进迭时空K1-RISC-V平台和大象机器人280RISC-V版本六轴机械臂,通过集成阿里云SegmentCommonImage算法、百度千帆的自动语音识别(ASR)系统以及大型语言模型(LLM)和多模态模型(VLM),打造一款桌面级的多模态AI机械臂。该机械臂的核心设计目标是实现环境感知、智能决策和实体交互能力的深度融合,从而能够理解并执行复杂的自然语言指令,完成一系列精细化的操作任务。具体而言,项目致力于构建一个从多模态信息输入(视觉、语音)到语义理解,再到任务规划与机械臂精准执行的完整闭环系统。项目的核心是要求机械臂能够“看得见”、“听得懂”,更要能够“思考”并“行动”,最终实现人机协作的智能化和自然化。通过这一设计,我们期望突破传统机械臂仅能执行预设程序的局限,赋予其更强的环境适应性和任务灵活性,为智能制造、智能服务等领域提供一种全新的、更具智能的解决方案。
机械臂:大象机器人Mycobot 280 RISCV
开发板:进迭时空K1 8核
- 考虑到Ubuntu限制了直接在系统环境中安装第三方库,因此你需要使用Pyenv进行开发环境隔离(Anaconda暂时没有发行RISCV版本)
- 需要配置Python 3.12+及所需环境包(在Requirements.txt文件夹中)
- 将API_KEY.py中的密钥和KEY换成你自己的,相关base_url和测试可用的模型已经填好
- 请正确安装并检查外设(末端执行器、摄像头与麦克风等)
中科(梁溪)人工智能实验室
中科院半导体所 赵博士 林博士
江南大学 祖同学
大连海事大学 陆同学
进迭时空售后技术支持团队