拓天大模型
拓天大模型具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。
产品名称:
拓天大模型
产品简介:
拓尔思拓天大模型是拓尔思融合NLP领域30余年技术积累、10余年高质量数据与知识资产建设经验,以及10000多家企业级用户应用实践打造的多模态大模型产品。
拓天大模型具有中文特性增强的可控生成技术、融合搜索引擎的生成结果可信核查、融合稠密向量的跨模态能力加强以及支持外界知识及时更新四大创新点。
产品定位:
拓天大模型定位于行业大模型,基于拓尔思多年来积累的高质量多模态的数据集及领先的语义人工智能技术,针对通用大模型训练可信、可控、安全和时效的问题,解决大规模中文多模态数据处理手段单一、文本生成内容不可控、专业度不够、计算资源受限等难题,建立面向金融、政务、媒体、网信等领域的高可信可控的领域大模型。
产品说明:
拓天大模型,基于千亿级全域高质量数据和自主可控的向量数据库技术,支持语义理解、多轮会话、长文本生成、跨模态交互和知识型搜索等核心能力,参数达百亿级,token量达到500B。拓天大模型聚焦优势行业用户,面向媒体、政务、金融、舆情垂直领域推出专业大模型,具备中文特性加强、专业能力加强、实时数据接入、内容安全、价值观对齐和支持私有化部署等特点,并与业务场景深度融合,为用户带来生产力变革。
产品核心功能:
a) 拓天拥有内容生成、多轮对话、语义理解、跨模态交互、知识型搜索、逻辑推理、安全合规、数学计算、编程能力和插件扩展十大基础能力。
b) 对话问答平台是基于拓天大模型的问答平台,具备智能交互、统计分析、知识管理和系统管理四大功能模块。
c) AIGC智能写作助手是基于拓天的公文写作平台,旨在帮助用户快速、准确地撰写各种公文,提高写作效率和质量。
d) 拓天链agent,结合知识库、工具组件及大模型能力,简化开发流程,通过无代码/低代码快速构建和部署AI应用。
产品亮点:
1. 中文特性增强的可控生成:通过中文官媒及中宣知识注入、价值观对齐以及安全围栏等方法,训练社会主义价值观的“价值观”和“偏好”。
2. 生成结果可信核查:采用向量数据库技术对生成结果进行事实检查及错误修订,确保生成文本有据可依。
3. 知识库与大模型的融合:采用增量微调与数据增强、图谱增强结合的知识注入方法,解决大模型无法访问外界知识、知识更新不及时等问题。
产品参数:
产品版本:V1.0 |
操作系统:Linux |
所属类别:垂类大模型 |
上架时间: |
适用场景:
a) 公文写作、金融研报生成、技术综述生成、舆情报告生成等。
b) 政务问答、企业在线问答等。
c) 文本纠错、知识校对、敏感内容检查等。
d) 风格改写、归纳总结等;
e) 数据加工、知识抽取、图谱构建等。
产品优势:
a) 信创支持:
拓天支持华为昇腾910B、海光等各种国产GPU以及飞腾、鲲鹏、龙芯、申威等国产CPU以及各种国产操作系统。
b) 支持本地部署:
拓天通过剪枝、量化、稀疏、蒸馏等技术,有效降低算力需求。参数百亿级,主流单推理卡即可满足运行要求。
c) 专业及实时数据接入
针对模型训练成本高,外部知识难以及时更新等问题,通过外挂知识库结合自研向量数据库实现专业领域实时数据的融合利用。
产品规格:
a) 参数规模包括百亿、千亿等多个版本。
b) 上下文窗口长度提供32K、128K等多个版本
c) 提供金融、政务、媒体、网信、专利等多个垂直行业版本。