迈特芯文本具身智能产品线介绍

深圳市迈特芯科技有限公司以创新为驱动，凭借全新具身智能卡，推出一系列前沿智能化产品方案，引领各行业步入智能化新纪元。近期，迈特芯发布多项文本具身智能新品，详情如下：

量化集成工具链

迈特芯成就智能新高度——文本大模型成功具身于智能卡之上，蜕变为一台本地化部署的文本智能体。我们的文本大模型量化工具链，采用行业领先的量化技术，以极致高效的方式精心部署，确保智能卡上的模型部署精准快速，非常适合智能问答，知识图谱，智能控制等领域的应用场景，让智能触手可及。

功能：一键实现大模型的压缩，评估，编译，端侧部署。

压缩：通过GUI界面配置大模型量化和剪枝参数，包括AI框架选择，模型选择（model)，数据集（dataset)，选择量化剪枝方法选择（method)，量化比特数(wbits)，批处理样本数(nsamples)等; 对于部分量化/稀疏方法，可以实现针对每层的每个组件单独配置量化/稀疏方法。

评估：通过GUI界面可在模型压缩过后选择数据集进行测评。包括困惑度，推理速度，零样本能力等。

编译：端到端的编译方案，能够动态编译所有的操作符并将整个模型映射到FPGA-CPU异构系统上（EdgeLLM,课题组成果)。

端侧部署：将量化/剪枝后的大模型部署到FPGA，CUDA等端侧设备，实现大模型端侧运行。

具体配置：

AI框架：支持pytorch，tensorflow，Mindspore；

大模型：LLAMA，ChatGLM，Qwen等；

硬件平台：NVIDIA，迈特芯等；

量化方法：GPTQ,APTQ（课题组成果,DAC2024）,AWQ, SommthQuant等；

剪枝方法：Wanda，SparseGPT，Barbar(课题组成果）等；

数据集：c4，WikiTest2，Pile等。

本地化文本大模型

大模型部署于文本大模型具身智能卡中，视频中左边窗口为权重预写入HBM的过程，等待权重全部写入完毕后，右边窗口则为demo文本对话的client交互界面，主要展示了问答对话、自由发挥创作、实时翻译以及文本总结功能。由于实现了全本地化部署，右下角可见网络为断开状态。

办公AI助手套件

迈特芯套件基于自研技术，整合优化 Qwen - VL、DeepSeek - R1 等大模型能力，关键亮点是实现 AI 应用智能卡本地化部署，为企业提供安全、高效、精确、便捷的智能化办公方案，保障数据安全与隐私。

迈特芯发布的首批核心 AI 助手涵盖企业关键运营场景。

智能专利文献检索 Agent 为研发、法务和战略部门设计，能快速精准查询专利，提炼关键信息，助企业掌握行业动态。

智能票据识别 Agent 聚焦财务和行政场景，可安全高效提取多种文档中单据的关键要素，降低云端依赖与成本，提升数据安全性。

智能人才管理 Agent 赋能人力资源部门，能解析简历，依据岗位要求提取关键信息并评分排序，优化招聘流程，提升效率与质量。

医学病原检测具身智能体方案

迈特芯成功将大模型本地化部署于精准化医疗与临床辅助诊断领域，实现原始数据输入、自动化流程分析、病原检测结果等信息的快速提取。凭借高效的数据处理能力，该方案不仅能即刻输出病原解读与辅助诊断报告，还大幅降低医疗大模型落地成本，显著提升临床数字化水平与辅助决策效率。其适用于科研机构与医疗院所，助力加速医疗智能化转型进程，为医疗领域带来更安全、高效的智能解决方案。

END