深圳市迈特芯科技有限公司以创新为驱动,凭借全新具身智能卡,推出一系列前沿智能化产品方案,引领各行业步入智能化新纪元。近期,迈特芯发布多项文本具身智能新品,详情如下:
1
量化集成工具链
功能:一键实现大模型的压缩,评估,编译,端侧部署。
压缩:通过GUI界面配置大模型量化和剪枝参数,包括AI框架选择,模型选择(model),数据集(dataset),选择量化剪枝方法选择(method),量化比特数(wbits),批处理样本数(nsamples)等; 对于部分量化/稀疏方法,可以实现针对每层的每个组件单独配置量化/稀疏方法。
评估:通过GUI界面可在模型压缩过后选择数据集进行测评。包括困惑度,推理速度,零样本能力等。
编译:端到端的编译方案,能够动态编译所有的操作符并将整个模型映射到FPGA-CPU异构系统上(EdgeLLM,课题组成果)。
端侧部署:将量化/剪枝后的大模型部署到FPGA,CUDA等端侧设备,实现大模型端侧运行。
具体配置:
AI框架:支持pytorch,tensorflow,Mindspore;
大模型:LLAMA,ChatGLM,Qwen等;
硬件平台:NVIDIA,迈特芯等;
量化方法:GPTQ,APTQ(课题组成果,DAC2024),AWQ, SommthQuant等;
剪枝方法:Wanda,SparseGPT,Barbar(课题组成果)等;
数据集:c4,WikiTest2,Pile等。
2
本地化文本大模型
大模型部署于文本大模型具身智能卡中,视频中左边窗口为权重预写入HBM的过程,等待权重全部写入完毕后,右边窗口则为demo文本对话的client交互界面,主要展示了问答对话、自由发挥创作、实时翻译以及文本总结功能。由于实现了全本地化部署,右下角可见网络为断开状态。
3
办公AI助手套件
迈特芯套件基于自研技术,整合优化 Qwen - VL、DeepSeek - R1 等大模型能力,关键亮点是实现 AI 应用智能卡本地化部署,为企业提供安全、高效、精确、便捷的智能化办公方案,保障数据安全与隐私。
迈特芯发布的首批核心 AI 助手涵盖企业关键运营场景。
智能专利文献检索 Agent 为研发、法务和战略部门设计,能快速精准查询专利,提炼关键信息,助企业掌握行业动态。
智能票据识别 Agent 聚焦财务和行政场景,可安全高效提取多种文档中单据的关键要素,降低云端依赖与成本,提升数据安全性。
智能人才管理 Agent 赋能人力资源部门,能解析简历,依据岗位要求提取关键信息并评分排序,优化招聘流程,提升效率与质量。
4
医学病原检测具身智能体方案
迈特芯成功将大模型本地化部署于精准化医疗与临床辅助诊断领域,实现原始数据输入、自动化流程分析、病原检测结果等信息的快速提取。凭借高效的数据处理能力,该方案不仅能即刻输出病原解读与辅助诊断报告,还大幅降低医疗大模型落地成本,显著提升临床数字化水平与辅助决策效率。其适用于科研机构与医疗院所,助力加速医疗智能化转型进程,为医疗领域带来更安全、高效的智能解决方案 。