(28篇)DeepSeek理论文章、使用方法技巧和政务信息素材汇编

(28篇)DeepSeek理论文章、使用方法技巧和政务信息素材汇编

目 录

1.人民中科研究院院长李兵 研究员阮晓峰、吴方:

政务系统接入DeepSeek几个问题不容忽视……………………………………1

2.郑州市委政研室韩枫桦:

关于DeepSeek融入机关工作的几点思考………………………………………4

3.中国社科院研究员姜奇平:

谁将取代DeepSeek——对DeepSeek的冷思考…………………………………7

4.商洛市直科技系统干部学习使用DeepSeek交流发言汇编……………………16

5.经济观察报记者周悦:

关于DeepSeek,误读与幻觉……………………………………………………21 6.永州市政务迈入AI时代DeepSeek私有化大模型赋能政务服务………………27 7.杨晓宇:DeepSeek大模型赋能石油化工行业—石化央企引领AI与能

源融合新浪潮…………………………………………………………………28

8.洪观新闻记者万磊:

“DeepSeek+政务”热潮彰显技术赋能强大力量……………………………31

9.侠客岛对话郑永年:DeepSeek带来的震撼与启示……………………………32

10.经济参考报记者王璐:

“牵手”DeepSeek央企“AI+”行动提速…………………………………35

11.光明日报调研组:

DeepSeek“破圈”意味着什么………………………………………………38

12.第一财经日报记者钱童心:

从阿里巴巴到DeepSeek: 政府有所不为, 企业大有作为……………………47

13.中国经济周刊记者侯隽:

对话董煜: 跑出DeepSeek, 中国做对了什么…………………………………51

14.中国新闻出版广电报记者朱子钰:

对接DeepSeek,主流媒体破浪前行…………………………………………54

15.中国新闻出版广电报记者朱子钰:

DeepSeek首秀媒体圈:首批尝鲜者讲“拥抱”感受………………………58

16.中国出版传媒商报记者张馨宇:

数字出版人热议DeepSeek……………………………………………………63

17.文艺报记者刘鹏波:

网络作家PKDeepSeek,谁赢了?……………………………………………77

18.文艺报记者刘鹏波:

DeepSeek强势出圈,写诗不再神秘?………………………………………82

19.山东商报记者吴绍博:

DeepSeek诠释遥遥领先………………………………………………………86

20.山西日报记者刘慧芳:

爆火的DeepSeek到底是啥……………………………………………………90

21.成都日报锦观新闻记者胡瑰玮:

DeepSeek“驯化”攻略爆火靠谱吗?………………………………………93

22.经济参考报记者张漫子:

DeepSeek颠覆了什么?——大模型“国产之光”破局的启示……………95

23.南方日报记者刘越亚马芳:

DeepSeek火了大湾区如何作答?…………………………………………100

24.解放日报记者顾泳:

DeepSeek本地化部署与医院系统深度对接………………………………106

25.中华工商时报记者蒋元锐:

DeepSeek将为各行业注入全新活力………………………………………108

26.北京日报记者孙云柯孙颖:

上线DeepSeek助手,人工智能助力城市治理、政务服务更快捷更高效…110

27.中国电子报记者齐旭:

多地“AI公务员”上岗……………………………………………………112

28.上海证券报记者李雁争:

政务系统接入DeepSeek多地数字政府建设进入深化提质阶段…………116

29.北京商报记者金朝力:

多地政府接入DeepSeek智慧政务不止效率………………………………118

30.北京晚报记者孙云柯孙颖:

多区政务平台接入DeepSeek………………………………………………121

31.广西日报记者关海芳罗婧:

广西多家医院接入DeepSeek………………………………………………123

32.惠州日报记者游璇钰:

惠州12345热线引入DeepSeek………………………………………………127

33.济南日记者曹雅欣:

普通人怎样当好AI玩家?…………………………………………………129

34.南方日报记者钟哲吴雅楠吴少敏:

千行百业为何纷纷接入DeepSeek?………………………………………133

35.乌鲁木齐晚报记者王媛媛:

亲测12345热线: DeepSeek赋能, 体验高效升级……………………………137

36.南方日报记者刘珊:

全国首创!广州公共资源交易平台全面接入DeepSeek……………………140

37.解放日报记者巩持平:

让DeepSeek替代公务员能给群众倒一杯热茶吗…………………………143

38.南方日报记者唐亚冰:

全省多个地市已部署上线DeepSeek,粤探索AI赋能公共治理……………149

39.北京商报记者魏蔚:

众说纷纭DeepSeek…………………………………………………………151

政务系统接入DeepSeek几个问题不容忽视

人民中科研究院院长李兵 研究员阮晓峰、吴方(2025年2月28日)

数字化转型浪潮席卷各行各业,大模型在政务服务领域的应用已成为政府提升服务水平的重要抓手。作为一款开源大模型,DeepSeek凭借其在成本和性能上的优势,在政务服务、公共管理和城市治理等多个领域展现出巨大的应用潜力。然而,在未经过系统论证和整体规划的情况下,简单地接入或碎片化地部署DeepSeek,将面临数据安全、系统适配、成本效益等多重挑战。

一、赋能政务服务现状

据不完全统计, 全国已有超过100家政府单位接入DeepSeek, 涵盖智能问答、政策分析、交通便民、12345热线等多个场景。这些实践表明,政府正在努力让DeepSeek成为提升服务效能的重要工具,争取为公众带来更便捷、更智能的服务体验。但同时部分地方也出现了“你上我也上”的现象,缺乏对实际需求和应用效果的系统性思考和论证,个别地方甚至出现了夸大宣传。

二、暴露出来的问题

如果未经系统化的规划和设计,简单地部署DeepSeek大模型也面临诸多风

险。

资源浪费与效率失衡风险。目前,部分地方政府在引入DeepSeek时缺乏统一的规划和标准,导致重复建设和资源浪费。例如,一些地方政府在未充分评估实际需求的情况下,投入大量资金引入DeepSeek及算力设备,但由于技术适配性不足或使用场景有限,最终未能实现预期效果,造成投入产出比失衡。此外,当前人工智能技术发展很快,不断出现新的技术和设备迭代,如果没有进行系统和长远的规划,数月之后又要进行系统升级甚至重建。

生成式模型的幻觉所引发的可信度风险。DeepSeek作为生成式AI模型,其输出结果可能存在不可解释性和“幻觉”问题,即生成的内容看似合理但并不符合实际情况。在政策咨询场景中,如果系统提供的答案存在错误或误导性信息,可能引发公众对政府服务的不信任,甚至导致决策失误。

数据安全与模型可靠性带来的系统性风险。DeepSeek的应用依赖于海量数据的训练和调用,这可能带来数据泄露、滥用或被恶意攻击的风险。例如,政务数据中涉及大量敏感信息,如果安全防护不到位,可能导致隐私泄露、数据

篡改等,进而影响政府公信力和社会稳定。

过度依赖技术导致的系统脆弱性与应急能力不足风险。如果政府部门过度依赖DeepSeek等人工智能技术,可能导致系统在面对技术故障、网络攻击或突发事件时显得脆弱。例如,一旦DeepSeek系统出现故障,可能直接影响政务服务的正常运行,甚至引发公众对政府应急能力的质疑。

三、建议对策

对策建议框架示意图

一是准确评估业务应用场景对模型的需求,避免资源浪费与效率失衡。在引入DeepSeek之前,政府部门应充分调研和评估实际业务场景的需求,明确技术的适用性和优先级。例如,对于高频、标准化程度高的业务(如政策咨询、信息查询),可以优先引入DeepSeek以提升效率。而对于复杂、涉及重大决策的业务,则需谨慎评估技术的适用性。同时,建议建立统一的建设标准和评估机制,避免各地重复建设,确保资源投入与产出效益相匹配。

二是准确评估模型和算力成本,平衡投入与收益的关系。在推进DeepSeek大模型与政务服务的深度融合前,系统化论证算力资源、模型开发运维成本与业务收益的平衡关系,是规避技术盲目投入、实现可持续智能化转型的核心前提。例如有的行政审批的智能化应用中,人工智能系统虽将部分环节处理时间

大幅压缩,但因需额外增设人工复核岗位,实际综合成本不降反升。因此,需通过严谨的经济性论证,才能避免因短期政绩驱动导致的资源错配,真正实现“技术投入-治理效能-财政可持续性”的三角平衡。

三是准确评估数据载体的安全边界,筑牢数据安全防线。DeepSeek的应用依赖于海量数据的训练和调用,因此必须明确数据的安全边界,确保敏感信息不被滥用或泄露。具体措施包括,对于非公开数据,要禁止使用API调用的方式,避免数据被截取或泄露。同时,优先采用国产化算力基础设施,确保数据主权和系统安全性。此外,引入加密技术和访问控制机制,防止数据在传输和使用过程中被篡改或窃取。定期开展数据质量与安全审计,及时发现和修复潜在风险。通过这些措施,确保数据在安全边界内高效流动,为DeepSeek的应用提供可靠保障。

四是建立内容安全常态化防控机制,提升技术可信度与公众信任。针对DeepSeek可能存在的生成内容不可解释性和“幻觉”问题,政府部门应建立常态化全生命周期的内容安全防控机制。在模型上线前,要对模型和相关数据进行全面的内容安全评测,达到安全要求方可上线。模型上线后,要对模型运行中的输入内容、推理过程和输出结果进行实时监测和防控。此外,应构建内容安全“红队攻击”机制,不定期对模型进行模拟攻击以发现漏洞,时刻保障智能系统的安全性。

四、结语

DeepSeek大模型在政务领域的应用可以为政府服务带来效率的提升和智能化水平的升级,但同时也面临资源浪费、数据安全、技术可信等多重挑战。需要准确评估业务需求、平衡投入产出、筑牢数据安全边界、建立内容安全防控机制,主动应对这些潜在风险,推动技术与政务服务的深度融合,为公众提供更智能、更可靠的政务服务。

关于DeepSeek融入机关工作的几点思考

郑州市委政研室韩枫桦

目前,DeepSeek人工智能大模型作为一种新兴的技术,正快步“融入”机关工作。前不久,在郑州“新春第一会”上,省委常委、市委书记安伟提出:“聚焦打造智慧政府、责任政府、法治政府,加快引入DeepSeek等大模型,以AI技术全面植入、 全面赋能政务服务, 有效提升智能化、 精准化、 无纸化水平。 ”为有效推进DeepSeek等大模型加快融入机关工作,提升政务数据处理能力,优化行政决策,推动政务流程智能化,促进跨部门协作与信息共享,笔者认为应进一步解决好DeepSeek等大模型融入机关工作可能面临的数据安全和隐私保护等问题。

一、明确目标与定位

一方面DeepSeek等大模型确实能提高工作效率,提升决策质量,增强机关的服务能力和水平。另一方面它只是辅助工具,它不能完全替代人的工作。它能为机关的决策和工作提供数据支撑,确保决策和工作客观、准确。它能推动机关工作的创新,提高工作的质量和水平。

机关在优化行政决策过程中,可以利用DeepSeek等大模型技术进行数据分析和预测,从而更好地制定政策。例如在公共健康领域监测疫情传播趋势并预测潜在风险,以提前采取应对措施。同时,通过自动化工具减少人为干预,提高决策的客观性和准确性;在推动智能化政务流程中,可以实现政务流程的智能化升级。

另外,还可用于优化内部管理流程,如公文处理和资源分配等,提升整体行政效率。它在支持多模态数据处理与分析中,不仅在文本处理方面表现出色,还支持图像、语音等多种数据类型的处理,使其在行政管理中具有广泛的应用潜力,尤其是在促进跨部门协作与信息共享,其开放性和灵活性能够整合不同部门的数据资源,实现跨部门的信息共享和协同工作。

但DeepSeek等大模型在融入机关工作时,可能存在数据安全和隐私保护方

面的隐患,例如可能涉及跨境传输导致信息泄露的风险。

二、数据安全与隐私保护

DeepSeek等大模型融入机关工作时,数据安全与隐私保护至关重要。既要建立严格的数据管理制度,又要加强对数据的加密、备份和访问控制,确保数据安全和保密。同时,要严格遵守相关法律法规,保护公民的个人隐私。

建立严格的数据管理制度。要明确数据的收集、存储、使用和共享规则,

确保数据的合法性、安全性和保密性。要加强对数据访问的权限管理。

建立严格的数据加密技术。采用先进的加密技术对数据进行加密处理,防止数据在传输和存储过程中被窃取或篡改。同时,定期对数据进行备份,防止数据丢失或损坏。

建立严格的数据安全培训。对工作人员进行数据安全和隐私保护的培训,提高他们的安全意识和操作技能,避免因人为疏忽导致的数据泄露。

建立严格的应急响应机制。一旦发生数据安全事件,能够及时采取措施进行处理,降低损失和影响。只有在确保数据安全与隐私保护的前提下,DeepSeek才能更好地融入机关工作,发挥其应有的作用。

三、与现有系统的融合

DeepSeek等大模型融入机关工作,要通过全面评估、合理方案、加强沟通协作以及充分测试验证等措施,实现与现有系统的有机融合。在DeepSeek等大模型融合过程中,要充分考虑系统的兼容性和稳定性,避免出现系统冲突和数据丢失等问题。

进行全面的系统评估。深入了解现有系统的功能、架构和运行情况,找出

其优势和不足之处,为DeepSeek等大模型融入提供依据。

制定合理的融合方案。根据评估结果,结合DeepSeek等大模型的特点和优势,设计出既能充分发挥DeepSeek等大模型作用,又能与现有系统无缝衔接的融合方案。

建立有效的沟通机制。在DeepSeek等大模型融合过程中,涉及多个部门和人员,需要加强沟通与协作,确保各方能够理解和支持融合工作。

进行充分的测试验证。在融合方案实施后,要进行充分的测试和验证,确保DeepSeek等大模型与现有系统的融合达到预期效果。对测试中发现的问题,要及时进行调整和优化,以提高系统的稳定性和可靠性。

四、人员培训与能力提升

DeepSeeK等大模型要在机关发挥应有的作用,需要对机关工作人员进行相关业务培训,使工作人员能够熟练掌握DeepSeeK等大模型的实际操作方法,提高机关人员对DeepSeeK等大模型新技术的认识和应用能力,提升工作效率和质量。一要明确具体培训目标。二要建立完善的考核机制。三要注重能力提升的持续性。

五、持续优化与改进

DeepSeeK等大模型融入机关是一个不断完善和优化的过程。要建立有效的反馈机制,及时收集用户的意见和建议,根据实际需求进行持续优化和改进,确保DeepSeeK等大模型能够更好地满足机关工作的需要。

建立紧密的合作机制。深入了解机关的工作流程和需求,确保DeepSeek等

大模型与之紧密结合。这需要与相关部门进行充分的沟通和调研。

建立有效的反馈机制。鼓励机关工作人员提出对DeepSeek等大模型使用的意见和建议,及时收集并分析这些反馈信息,以便发现问题并进行针对性的改进。

建立完善的维护机制。根据机关工作的实际需求,对DeepSeek等大模型进行技术升级和功能拓展与维护,让机关工作人员充分了解DeepSeek等大模型优势和使用方法。

建立科学的评价机制。定期对DeepSeek等大模型融入机关工作的效果进行评估。

总之,DeepSeeK等大模型融入机关需要在目标定位、数据安全、系统融合、人员培训和持续优化等方面下功夫,以提升政务数据处理能力、优化行政决策过程、促进跨部门协作与信息共享等,提高决策的客观性和准确性,提升整体行政效率,全面提高机关工作效率和服务质量。

谁将取代DeepSeek——对DeepSeek的冷思考

中国社科院研究员姜奇平

一、DeepSeek的一般情况(一)DeepSeek是谁

DeepSeek成立于2023年,公司位于中国杭州,由前对冲基金幻方(High-FlyerQuant)的领导者梁文峰创立。DeepSeek的主要特点是基于开源模型和提供低推理成本的技术。

DeepSeek聚集了一支年轻、技术技能出色的团队,其核心目标是推动通用人工智能(AGI),并以透明和开源的方式进行研究,同时强调通过低成本的技术使先进的人工智能(AI)更容易获取。

(二)DeepSeek的成就

DeepSeek在模型开发上采用了混合专家架构(MoE)等先进算法,这有助于节省显存资源,并提高底层算力的使用效率。这种技术思路在DeepSeek-V2中已经得到验证。

公司通过开源其模型和相关技术,允许更多的AI团队基于这些最先进且成本最低的技术开发新的应用。

DeepSeek-R1是公司推出的一款模型,在短时间内登顶苹果美国区应用商店

免费App下载排行榜,并在中国区也取得了领先的位置。

该模型在多个领域(如文本创作、代码生成等)达到了与OpenAI相当的水

平,但成本仅为OpenAI模型费用的一小部分。

DeepSeek的突出功能之一是其令人难以置信的非常低的API调用价格,使高级AI更容易访问。例如,DeepSeek-R1的起价每百万输入Token为0.55美元、每百万输出Token为2.19美元,这一价格远低于OpenAI或其他美国AI实验室的产品。

(三)DeepSeek引起的市场轰动DeepSeek的成功可能会促使

OpenAI和其他美国供应商降价以保持现有的领先地位。如果更高效的模型能够以少得多的支出参与竞争,那么人们就会质疑Meta和微软等公司的巨额支出,他们分别承诺在2025年将至少650亿美元主要投入在AI基础设施上这一资本支出。

DeepSeek在全球市场掀起风浪,阿斯麦、英伟达等之前受益于AI服务需求欣欣向荣的股票大跌,而科大讯飞等与DeepSeek相关的中国股票则出现上涨。

1月27日,纳斯达克100指数期货跌幅扩大至5%,标普500指数期货下跌3%。欧洲方面,科技股领跌,芯片设备制造商阿斯麦控股下跌11%,Cboe波动率指数(VIX)走高。如果此番跌势维持,纳斯达克100和欧洲斯托克600科技股指数所蒸发的市值总额将达大约1.2万亿美元。

“DeepSeek的成功显示出开发成本较低的强大AI模型是可能的,”瑞士联合私立银行(UnionBancairePrivee)董事总经理Vey-SernLing表示,“这可能会冲击目前由少数科技巨头高额支出来驱动整个AI供应链的投资逻辑。”

(四)DeepSeek的创新

DeepSeek-V3和DeepSeek-R1都利用了混合专家架构(MoE),该架构仅激活其6710亿个参数中的一个子集。可以把它想象成部署数百名专业的微观专家,在需要他们的技能时介入。这种设计确保了计算效率,同时保持了高模型质量。

DeepSeek采用纯强化学习(RL)方法,进一步使其与众不同。这些模型通过连续的反馈回路自主学习和改进,实现自我校正和适应性,这种机制显著提高了其解决问题的能力,特别是对于需要深入推理和逻辑分析的任务。

除了MoE,多头潜在注意力机制(MLA)提高了模型同时处理多个数据流的能力。通过将焦点分布在几个“注意力”头上,可以更好地识别上下文关系并处理细微的输入,即使在处理单个请求中的数万个Token时也是如此。

(五)用户评价

用户对DeepSeek-R1的高度评价主要集中在其思考过程的细腻性、自洽性和

全面性上,它能够提供深度和细节丰富的输出。

一些用户也指出了DeepSeek在某些方面的“用力过猛”,如生成过于复杂的语言或不适当的用词,特别是针对特定受众(如儿童)的内容。

DeepSeek面临的技术挑战包括如何进一步优化模型的性能、降低成本的同

时保持高效率,以及克服可能存在的幻觉和偏差问题。

DeepSeek公司正在专注于增强其“DeepThink+Web”搜索的功能,以实现实时在线查找能力。此外,还考虑开发针对特定行业的定制化模型,以及建立全球合作伙伴关系。

二、关于DeepSeek影响的分析

与DeepSeek基本信息相对的,是其所产生的巨大影响。这些影响中有哪些

是短期性的,哪些可能是长期性的?

(一)对中美战略竞争的影响:“星际之门”计划

DeepSeek对中美战略竞争的影响,首先表现在对美国“星际之门”计划(theStargateproject)的影响。2025年1月22日,美国总统特朗普在白宫新闻发布会上宣布启动“星际之门”计划。这一计划被称为“21世纪AI时代的‘星球大战’计划”。

“星际之门”计划由软银、OpenAI、甲骨文等科技巨头联合推动,注资高达5000亿美元。该计划旨在建设先进的数据中心和配套基础设施,以支持人工智能技术的快速发展,预计在未来四年内完成。

DeepSeek出现后,一个显而易见的疑问是美国耗费5000亿美元的计划所完成的工作。中国人难道不能用500亿美元甚至更低的成本完成,乃至做得更好吗?这样一来,“星际之门”计划还有意义吗?因此特朗普评价道,DeepSeek的问世是一记“警钟”。

DeepSeek对“星际之门”计划的影响主要体现在技术竞争、市场情绪、政策与战略调整等方面。

首先,技术竞争方面,DeepSeek凭借其低成本、高性能的技术优势,给AI行业带来了新的竞争格局。“星际之门”计划的参与者可能会重新评估投资策略和技术方向,思考是否有更高效低成本的方式实现目标。例如,原本计划大量投入算力资源的企业可能会因DeepSeek的出现而调整策略,这增加了美国在人工智能领域的技术竞争压力。

其次,市场情绪方面,DeepSeek的发展吸引了市场的关注,使得投资者对高成本AI相关项目产生了怀疑。DeepSeek的市场预期和成本估值,会吸引更多投资者关注。

最后,政策与战略调整方面,DeepSeek的成功表明中国科研团队在有限条件下通过创新实现了弯道超车,这可能会促使美国政府重新评估“星际之门”计划的可行性和成本效益,进行政策与战略上的调整。

此外,抛开成本不说,马斯克质疑“星际之门”计划的融资情况。这一计划似乎没有与马斯克很好沟通。马斯克在社交平台发文说,“他们实际上没有钱”“软银能确保的资金远低于100亿美元”。这是暗指软银去年负债3.8万亿日元。马斯克还曾表示他“不信任”OpenAI的奥特曼。

美国《外交政策》(ForeignPolicy)上的文章《DeepSeek揭示了美中竞争的未来》(WhatDeepSeekrevealedaboutthefutureofU.S.-Chinacompetition)指出,DeepSeek的非凡成功引发了美国国家安全界的担忧,他们担心美国最先

进的AI产品可能再也无法与中国更廉价的替代品竞争。文章分析,美国一直在利用其对半导体供应链的控制,限制中国获取高端芯片。然而,DeepSeek取得的成功让一些人开始质疑,美国的芯片出口管制是否毫无作用,甚至适得其反。文章最后指出,如果美国和中国的AI模型都存在双方不确定如何控制的危险能力的风险,那么美国与中国领导层就此进行沟通则是国家安全的当务之急[1]。

(二)对中美科技竞争的影响

DeepSeek的问世,在科技界眼中,缩短了中美在AI上的差距。

Meta创始人兼CEO扎克伯格表示,DeepSeek非常先进,并认为中美之间的AI

差距非常小。

1 .. 不仅是中美之争本身,还是开源、闭源之争

图灵奖得主、MetaAI首席科学家YannLeCun在社交媒体上表示:“DeepSeek的成功凸显了保持AI模型开源的价值,这样任何人都可以从中受益。这表明开源模式正在超越专有模式。”他认为:“当人们看到DeepSeek的表现,惊呼中国AI正在赶超美国,但这种解读有误。更准确的结论是,开源模型正在超越闭源系统。[2]”

《福布斯》杂志则指出,DeepSeek的开源策略可能重塑全球AI标准,推动中国成为开源模型的主导者之一。《自然》杂志评价称,R1的开放性远超闭源模型的“黑匣子”特性。

由于美国公司出于商业利益,更倾向闭源系统,这给利用开源系统的中国公司更多机会,特别是在打造科技生态系统方面的机会,而这是以往中国相对于美国的薄弱环节。支持这一看法的事实是,DeepSeek因开放吸引了开发界的热烈响应,很短时间内就衍生出600多个应用。当然,国内科技界也有人对此持怀疑态度,主要是基于以往的开源往往在应用中被当作自主技术保守(伪开源)的历史。

DeepSeek目前还没有完全商业化,一旦商业化,将面临如何处理技术开放与商业模式开放的关系的问题。如果处理得好,如将基础业务与增值业务充分分开,形成互补,那么中国在这方面将形成对美国的优势。当然,中国如果在打造包容技术与商业开放的制度环境(如反垄断政策环境)方面落后于美国,也会使技术与商业上的优势化为乌有。

2 .DeepSeek对巨头的挑战

DeepSeek现在俨然具有了当年U盘替代软驱那种“同等功能、巨大价差”的

以小博大的势头。DeepSeek的崛起对现有的AI巨头如OpenAI、Meta等构成了挑

战,促使他们重新评估成本、战略和研究方法。

一是通过开源策略和低成本技术,DeepSeek为小型企业、研究人员和开发者提供了新的机遇。一旦形成良好开发生态,有可能重现当年谷歌取代雅虎的历史。DeepSeek目前已进入搜索技术领域,这要求百度打起十二分的精神来应对,懈怠就意味着出局。

二是随着用户采用率的增加和市场对AI能力需求的增长,DeepSeek有望继续在AI领域发挥颠覆性作用。公司可能会进一步优化模型性能、加强与硬件供应商的合作,并开发针对特定行业领域的定制化解决方案。

DeepSeek是通过开源技术、低成本策略和创新算法推动人工智能发展的中国初创企业,其成功不仅体现在市场表现上,还在于对AI社区的影响力,以及为小型企业和开发者提供的新机遇。随着未来的发展,DeepSeek有望在AI领域持续产生重大影响,并可能引领下一波变革性突破。同时,也要看到,DeepSeek的出现在中国不是偶然的。中国还有一批潜在的同类技术和公司即将浮出水面,包括阿里团队、李飞飞(华人)团队都已提出了初步的成果,共同推动AI的改朝换代。

3 .DeepSeek对投资的影响

DeepSeek的初步成功,引发了人们对OpenAI、微软和其他公司所追求的投资计划的重大质疑。

首先对OpenAI来说, DeepSeek以极低的成本实现极高性能, 让人们对OpenAI

投资回报能力产生怀疑。

将DeepSeek节俭、分散的创新,与OpenAI等其他开发商对集中、资源密集

型基础设施的依赖,进行了对比。

结果发现,打造一个世界水平AI模型,只需要投入巨头一个高管的年薪就可以做到,巨头动辄养着十几个、几十个这种价位的高管的合理性,就会遭到投资人普遍质疑,甚至会产生受骗的感觉。

可以想见,巨头内部现在慌作一团,即使为了保住工资,也有动机赶紧向投资人证明DeepSeek的种种不是。但问题是,如果与DeepSeek类似的小公司成批涌现时,想通过栽赃和甩锅来摆脱困境,将不会有效。

当然,有一点现在还看不清楚,这就是DeepSeek本身的资本模式。这家公司出身对冲基金。在DeepSeek这个案例中,对冲基金对AI的投入(包括包装与

炒作)是可以看清的;但AI的产出和商业化现在还没有发生,将会怎样,还有待观察。一旦演化成一个金融的故事,就会存在各种变数。从投资上,人们期待DeepSeek做实,而不要变成一个壳。

三、谁将取代DeepSeek:从一滴水看AI大海

作为专门研究人工智能的业内人士,还要跳出媒体与资本的喧嚣,用平常

心冷静观察DeepSeek,这样看出的门道自然有所不同。

(一)冷思考之一:DeepSeek是弯道超车还是换道超车?

人工智能的权威专家钟义信教授认为,DeepSeek还在传统轨道的同一个赛

道上,可以评价为“在同一个赛道上,DeepSeek以更优秀的技术超越了GPTo1”。

要看到在同一赛道弯道超车的局限。钟义信指出,DeepSeek的技术(主要是算法效率)比GPT更优秀,但是,两者的范式(科学观和方法论)是一样的。具体来说,两者的科学观都是把人工智能看作“人工脑”,两者的方法论都遵循“唯形式化”和“分而治之”。然而,研究人工智能所需要的真正科学观,是应该把人工智能看作“主体主导下的主体客体相互作用的信息生态过程” (即整体论)。

这是DeepSeek热中的一种冷思考。钟义信的观点无异于认为,DeepSeek与其追赶的OpenAI是同类,都是美国计算主义同一赛道上的赛手,区别只是一个跑了50步,一个跑了100步。

这与一般业内人士的见解(包括马斯克的见解)非常不一样,业内都是看到了开放与封闭路线的区别,看到微软收购OpenAI,使得OpenAI变成了一个忘记“初衷”的商业化工具。马斯克的不满很大程度也来自这里,而不是如特朗普认为的与“星际之门”计划中的某人“有仇”。不过在这里,钟义信进了一步,直指“初衷”本身存在的局限。

这涉及对人工智能本质的理解,属于一个更深的问题。现有AI主流坚持物质学科范式(强调客体计算,缺主体价值判断),这是其时代局限。这种局限在DeepSeek骨子里也有。未来取代它的,将是信息学科的范式,即强调客体与主体统一。从这个意义上说,下一步替代DeepSeek们的,将是克服主客二元论的AI新范式,由此开启换道超车。在前沿上,这一趋势的苗头在生成式AI中(如新生成主义,neo-enactivism)隐约可见。本周作出DeepSeek同类成果的李飞飞,其实就在这条路上,她的野心肯定不止于DeepSeek。

(二)冷思考之二:知还是行?

著名人工智能专家蔡恒进对DeepSeek的成就有一个独特的看法,认为

DeepSeek对巨头的冲击的意义不只在于成本,而在于模式。

蔡恒进说:“OpenAI现在走的路,就是把算力集中起来,把参数推上去来实现AGI,这实际上是世界的前景就变成很中心化的AI系统,然后这个系统会需要大量的资源、能量,还有芯片算力的集中。”而DeepSeek的发展是分布式计算的方向,这比业界一般的“开放-封闭”视野多了一个“集中-分布”角度。

蔡恒进同样主张主客一体的AI新范式,不满意计算主义的AI路线,认为“我们有人类或者生命的参与、有主观能动性”,要把这种主体性加入计算的客体性中。他具体提出了“认知坎陷说”,即一种加入布伦塔诺意向性的认知论。对于AI来说,“认知坎陷说”相当于一个“知难行易”模型。目前计算主义把重点放在前者(知难),体现为“AI的进步都是通过规模来实现的”“只有堆

算力才是成功的”(李德毅院士称为“暴力计算”)。他从理查德•  萨顿(RichardS.Sutton)的Thebitterlesson(可译为“苦涩的教训”)一文中,引出对通用算力的质疑。夸奖DeepSeek“实际上打破了这个结论”“已经偏离了那条路线了”,这是指DeepSeek不靠堆GPU而提高性能。蔡恒进主张的新方向,把重点放在后者(行易),相当于认为实践是简、认识是繁。计算主义重认知、轻实践,形成对通用算力和暴力计算的迷信。如果把AI的重点从认识转向实践,知行合一,就可以化繁为简。用他的话说,“并不是说规模越大越好,只是说在它那个场景里才能生成”。在走偏到客体方向的AI中加入主体因素的方法是,将算法从认识角度调整为实践角度,变为场景的认知、具身的认知,“只是根据场景或需要进行一定程度的数字化”。这与李飞飞的具身AI思路有相通之处。为此,“追求用更小的数据库、更少的语料、更小的系统来实现更高的智能,在我看来才是正确的方向”。人们在能行的时候,从不长篇大论,是因为有主体目标、意向在指引,将世界化繁为简到自己的目的上。

蔡恒进看好DeepSeek深度学习的方向,尤其是“不用人干预地强化学习”,

但是认为DeepSeek还可以进一步在可持续的自学习这个方向上改进。

(三)冷思考之三:向上与向下两条曲线

胡延平作为业内资深专家,这轮也没有跟着媒体跑,而是得出了独立的判断。他比较冷静地分析了当前形势,看出大模型的“两条路线”是向上曲线与向下曲线不同取向的分别,认为DeepSeek走在向下曲线的道路上。他说:“大模型现在是两条曲线交织的双螺旋进化。向上走的曲线,追求整体感知理解行

为能力的通用智能,拼的是整体理解意义上的脑能力、思考和监督思考、视觉在内的整体理解,空间智能等现实模型、物理等科学模型、多模态更不在话下。思维链、皮层计算、不同模型原理是当下前沿探索的核心。向下走的曲线提升数据质量、训练意义上的量效比、算力能效比,大幅降低推理成本。DeepSeek在这个双螺旋里向下有余向上不足。[3]”

胡延平说:“向下曲线对成本效率有改变,但对捧得AGI圣杯的贡献可以忽略[4]。”他认为,DeepSeek没有展现分毫对未来的思考和探索,实质上依然处在追赶阶段。DeepSeek不仅属于古典LLM(大语言模型,LargeLanguageModel)范畴,呈现的其实还是“性价比”。

在胡延平看来,DeepSeek主要是对于合成数据、知识蒸馏、FP8低精度(FT8为一种8位浮点数格式)、稀疏模型、MoE,甚至包括多头注意力机制等“已有已知技术” 进行组合,“在资源和性能之间调优, 取得最佳平衡, 这是DeepSeek-V3的成功之处”。当然,对于什么才是值得追求的“AGI圣杯”,仁者见仁,智者见智。

(四)不冷不热地思考:高性能计算路线上的两种走法

我认为把DeepSeek当作一个事件看,代表的是高性能计算思潮的崛起,从

中既反映出DeepSeek的成就所在,也自然显示出其不足。

高性能计算是与美国相反的计算路线,在中国形成已有近20年历史。早在上个世纪,国家863计划就开始实施“国家高性能计算环境”项目。美国计算主义的路线无以为名,可称为高速度计算。高速度与高性能的不同,反映技术与技术经济的区别。技术不受资源(如GPU)制约时,越快就越好,主要靠上规模、堆硬件实现;技术经济在资源约束(从担心系统、芯片“卡脖子”到强调应用)下,强调性价比,一个突出特征是强调成本。打个形象的比方,同为轿车,美国车设计不太考虑省油,是因为石油资源不受限制;而日本车设计主要考虑省油,是因为担心石油哪天被断供。AI也是如此。

高性能计算路线在中国有两种走法,一种是弯道超车,另一种是换道超车。DeepSeek代表的是弯道超车的一支,如专家判断的,是在美式路线的既定赛道内,通过强化成本控制,提供高性价比的算力。走这条路,时间在前。DeepSeek只是第一个冒头的,最近五年会是不断开花结果之时。

DeepSeek的出现不是偶然的。梁文锋说取得成就是“站在巨人肩膀上”,国内外都误以为巨人是指巨头、大厂,其实不尽然。这个巨人应该说主要是中

国科研院校,特别是北大、北邮和清华三校。DeepSeek的140人团队,大多是这三校的应届毕业生。如果没有导师这个群体,以及国家高性能计算环境的近20年打造,梁文锋到哪儿去找那么多博士论文成果,连人带论文都拿来,而且拿来就可以用,用了就可以超过美国巨头。举例来说,DeepSeek的一个窍门是重视模型算法和硬件工程的配合,其中的技术就由这些学生以DeepSeek-AI的名义发表在论文Fire-FlyerAI-HPC:Acost-effectivesoftware-hardwareco-designfordeeplearning中。其中的HPC,就是高性能计算highperformancecomputing的缩写。美国巨头现在总觉得自己才是“巨人”,从DeepSeek这个鸡蛋里挑有没有自己的骨头(研究成果)。这些应届生是站在HPC这个巨人肩膀上成长起来的。其实巨头们找一下DeepSeek中全部应届毕业生的毕业论文,就知道技术是哪里来的了。

举例来说,要想了解DeepSeek中不常见的3D生成技术是从哪儿来的,到清华大学检索一下,可得知是清华博士生孙景翔在DeepSeek实习期间,与导师刘烨斌等共同完成的。诸如此类,不胜枚举。

高性能计算路线的第二种走法,目前还潜伏在冰山下的大海中,这种走法的特征是换道超车。所谓换道,就是指与美国主流计算主义分道扬镳的路线。最大的不同,在于范式。追的时候是同范式的,超的时候用的是不同范式。范式的不同,涉及的主要是对“科学是什么”的理解有了根本性的分歧。其中的思路,从国家数据空间发展战略中可以看到,目前国家数据空间发展战略正处在二期工程阶段。开花结果,还需要多年以后。应该说,DeepSeek作为中国应届毕业生群体的代表作,还没有进入这个主力赛道。

DeepSeek包括马上涌现的大批同行者,作为高性质计算这个大的中国思潮的一部分,只看到LLM成本问题的表层,即与AI物质科学范式有关的那一方面。当然解决了这方面的问题,成就也堪称伟大。但是,再过几年,美国人就会领教中国主力军团的出击,看到冰山一角下庞大的水下部分。那将是一场范式革命,是从目前的客体范式向未来的主客体统一范式转变的伟大长征。我们可以从上面介绍的钟义信、蔡恒进的思想中,从外围体会到其中的潮流上的思路。美国最前卫的科学家也有类似想法,但不成气候。而在中国,这不是一个人两个人的思想,而是代表整个群体走向共识的技术觉醒。

商洛市直科技系统干部学习使用DeepSeek交流发言汇编(2025年2月21日)

市科技局办公室闫啸玉

根据局里的统一安排,结合近期对DeepSeek的学习使用情况,现向领导和

同志们汇报我的学习体会:

一、探索与尝试

为了更高效地利用DeepSeek,我深入学习了文档与教程。了解了DeepSeek具有帮写代码、文本生成、智能搜索、数据分析、语言沟通以及论文辅助等多种功能。其中,主要针对与自身工作密切相关的功能进行了探索。在文本生成方面,我钻研了如何借助DeepSeek生成各种风格的文本,像是新闻稿件、创意写作以及小说创作等。我不断尝试不同的指令和参数设置,以探究其对文本的修改效果,从而能够根据实际需求灵活运用。按照教程,我成功将DeepSeek接入WPS,使办公软件具备了人工智能的特性。目前,我仍在持续探索和学习相关功能,以充分发挥其在办公中的作用。在人机对话方面,在学习使用过程中,DeepSeek能够对大部分语言指令做出及时响应,并能对所提出的问题给出正确回应。但偶尔在面对复杂且重复性较高的问题时,会显示服务器繁忙,这在一定程度上影响了使用体验。

二、收获与感悟

经过这几日的学习与使用,我深刻地感受到了DeepSeek的强大之处。第一,它极大地提升了工作效率。DeepSeek能够迅速回复所提出的问题,并快速获取所需的相关知识,为工作节省了大量时间。第二,它成为了内容创作的得力助手。DeepSeek可以辅助内容创作,帮助生成文章大纲、撰写初稿以及润色文字等,此次关于DeepSeek学习体会就运用了AI的润色文字和丰富内容的功能。第三,在创意写作方面,我尝试使用DeepSeek以自己的名字为主角创作了一篇短篇小说,这让我领略到了它在创意激发方面的潜力。第四,通过使用DeepSeek,我接触到了诸如人工智能、大数据、云计算等新的领域,拓宽了自身的知识视野。

三、未来展望

近日深圳市福田区推出基于DeepSeek开发的AI数智员工,这些新员工业务覆盖政务服务全链条。覆盖公文处理、民生服务、应急管理、招商引资等多元

场景。还有杭州电视台使用AI人工智能代替真人播报新闻等。我坚信,随着DeepSeek的不断发展和完善,它在更多的应用场景中将会取得更大的突破,具备更强大的功能以及更智能的交互方式。我也将继续努力学习和深入探索,充分利用DeepSeek的优势,让它成为我学习和工作中不可或缺的得力助手,为推动各项工作的开展贡献自己的力量。

市科技局秦创原建设科郑铎

今年春节,国产AI模型DeepSeek的横空出世,以“低成本高性能”重塑AI业态,让中国智算再次震惊世界。作为一名科技系统干部,这项堪称“国运级别的科技成果”让我切身感受到了创新的魅力!特别是DeepSeek已逐步应用到各行业领域中,释放出前所未有的强劲动能,用生动实践再次印证了“科学技术是第一生产力”。

经过半个多月的使用,我初步有以下几点体会,和大家交流分享:

1 .马太效应。所谓强者愈强、弱者愈弱。这是我使用DeepSeek获得的最大感受。换句话讲,越善于提问的人,受益会越多;越善于分解问题的人,用起来越顺手。所以,我自己总结出,使用它的诀窍就是“打破砂锅问到底”。同时,一定要学会开动脑筋,否则DeepSeek就是个大号百度,难以最大程度发挥出它的强大魔力。

2 .深度思考。如果想提高自己的认知能力,一定要把深度思考的功能打开。这是DeepSeek与其他AI软件最大的区别。我每次在提出问题后,会仔细阅读大模型对问题的细分拆解过程,这样也能让我慢慢学会如何思考问题。对此,我也深刻认识到,学习思考问题的过程要比答案本身重要1万倍。

3 .不讲废话。相比之前的AI软件,DeepSeek的答案要简洁很多,本质上,是它的逻辑性更强,内容更精准,甚至有些表述可以直接放到材料里面。这对于日常的工作,特别是文字材料撰写,提供了巨大的便利,也大幅提高了我们的工作效率。

4 .危机感。这里谈到的危机感并不是说人工智能会取代我们的工作,让我们饿肚子,而是要看到,在这个时代,真正先进的人,正在疯狂碾压大众的认知范畴,有太多人们赖以糊口果腹的常规技能,以及有太多的所谓让人自豪的经验,正在变得一文不值。这也给了我相当大的启示,因为AI技术正在飞速发展,也许不久后还有更为强大的模型出现,所以我们也必须要牢固树立终身学习的理念,就像庄子说过的:“吾生也有涯,而知也无涯”。

5 .把握机会。答案“平权”的背后,“求索问题”的能力差距反而会进一步拉大。所以,我觉得应当把握住当下AI的发展机遇,在学会思考的同时,强化自己提出问题的能力,但前提是自己得知道自己到底要什么。

最后有一点建议:大家可以考虑把市面上的AI软件配合交替使用,不必沉溺于DeepSeek无法自拔。 比如像 “豆包” , 它的服务器稳定性是强于目前DeepSeek模型的。此外,不同的AI模型生成的内容也会有所差异,这正好有利于我们进行对比参照,在答案内容上形成互补,最终凝练出问题的最优解。

市科技局资源管理科王青

DeepSeek和我们最早使用的通义千问、文心一言、豆包等AI工具的作用是一样的,但是为什么豆包们没火,DeepSeek火了。专业的解释有很多,很多专有名词超过我的认知范围,我觉得通俗的解释主要是因为它的“脑子”特别好使,特别擅长解决那些烧脑的问题,比如数学题、逻辑分析之类,它就像是我们身边的“学霸”朋友,成本低,用起来划算。豆包呢,更像是个“文艺青年”,画画、写文章、做视频样样都行,挺有意思的,但是这些功能更多是锦上添花,真正用到工作学习中的场景不多。所以相比之下,DeepSeek更接地气,实用性更强。再加上DeepSeek的开源策略(主要指它的源代码被公开,允许任何人免费查看、使用、修改和分发),吸引了很多技术公司来用,口碑一下子就传开了。豆包虽然也挺努力,但它的优势更多在“好玩”上,专业领域的存在感就没那么强了。

一、DeepSeek版本

DeepSeek分为满血版、蒸馏版和量化版。满血版:指的是完整参数版本,拥有最大的参数量,性能最强,能够处理复杂的推理和长上下文理解任务。蒸馏版:是通过知识蒸馏技术压缩大型模型得到的版本,参数量大大减少。量化版:是通过牺牲一部分模型的“精度”,压缩模型的大小。这样就可以减少运行所需的资源,提高运行的效率。我们用的网页版就是满血版,而蒸馏版和量化版就是可以单独下载到电脑上的版本,专有名词叫本地部署,是为了数据隐私、离线使用或者定制化需求。对电脑的硬件要求、环境配置、模型获取、部署方法等有较高要求。

二、用DeepSeek进行公文写作

本来这次的这个题目,还想尝试一下用DeepSeek帮忙,可能是自己还不会

用,搜出来东西和自己想表达的差的太远,在网上搜了一下,发现如果写出来

的内容不是想要的,大概率是提示词使用不准确,要准确的告诉DeepSeek你希望写出的内容大致结构框架是什么,用什么样的语言风格,生成字数在多少,需要围绕什么样的主题等等。主要有三种方式。一是仿写。如果对材料有一定的把握能力,可以试一试把你觉得好的文章发给Deepseek,让它按照你给的文章结构、字数、思路进行仿写。你就直接说:“请参照我发给你的文章风格和主题,进行仿写,以下是参照文章。。。”。二是扩写。你已经想好了文章框架思路,可以让DeepSeek根据你现有的内容进行扩写。你就写:“把我列出的工作内容总结扩展为1500字的个人年度工作总结。”三是润色。可以把写好的文章输入对话框,“请帮我把以上内容进行润色,要求符合公文用语的风格”等等。这方面可能需要我们长期探索,相信如果熟练掌握方法,会大大减少我们的工作量。

三、与各应用的接入

在DeepSeek官网的开发文档的“实用集成”,有一份“DeepSeek实用集成”名单,这里面有54款和DeepSeek相关的应用。只需要按照《DeepSeekAPI操作手册》开通API秘钥即可接入这些应用,让我们既可以把大语言模型部署在桌面客户端的,与AI轻松互动;也可以在微信上用DeepSeek管理笔记,满足在学习、工作、娱乐等多方面的需求。除了官方清单里的应用,还有不少企业官宣把DeepSeek模型集成到自家应用中,据统计这类新公布的应用有60个,涵盖金融、教育、医疗、办公、智能助手、娱乐购物等多个场景。我们使用最频繁的应该是WPS,大的方面可以帮我们进行文档处理、表格分析、多语言翻译、PPT制作,小的方面可以帮我们校证错别字,大大提高我们的工作效率。

总之,通过学习给我的体会是,别指望它全自动干活,真正的价值是把我们从重复劳动里解放出来。未来,要学会人机协同,善用AI的人,才是真正的效率之王。

市科技局创新发展科任洲

最近,我主要运用DeepSeek来修改材料和筛选表格内容,感受就是,想要得到高质量的思索结果,就必须准确掌握提问技巧,学会找好提问问题的角度和语言组织,明显提升了工作效率与质量。

一方面,精准输入需求,使用DeepSeek的第一步就是明确方向,组织好提问内容,清晰准确的输入需求。例如,撰写营商环境重点任务进展材料,因为营商环境涉及多个部门,作为科技局,就要突出科技对优化营商环境的贡献,

详细说明与科技相关、重点突出的工作内容。通过创新主体培育、科技人才支撑等服务内容,或深入调研、加强培训、简化手续等举措。通过对这些具体要求的输入,DeepSeekk就会生成更贴合本部门实际、更具针对性的内容框架和要点。同时,对材料中语句平淡的内容进行润色,提升质感,注意保持语言的简洁性和规范性,避免过度修饰导致表达模糊,对于个人的材料修改有了较大帮助。

另一方面,需要人工审核,虽然DeepSeek功能强大,但绝不能完全替代人工审核,材料中往往涉及政策、数据信息等关键内容,必须进行严格把关。最近使用DeepSeek查询了一些关于科技型企业的数据信息,以及对相关的表格进行内容筛选,发现生成内容还是有较大误差的,这就需要我们仔细核对数据的准确性,确保数据信息符合实际情况、常规逻辑和规范要求。另外,DeepSeek联网搜索的信息来源也五花八门,存在一定虚假、错误的信息,想要得到准确的信息,还需要一一判断生成内容的信息来源,然后形成自己的结果。

DeepSeek为材料撰写,信息搜索等日常办公提供了有力帮助,但在使用过程中,使用者还要以深厚的专业基础和业务能力为前提,只有充分发挥自身的专业知识和判断力,将人工智能工具与实际工作经验相结合,精准输入、合理借鉴、优化表达、严格鉴别,才能撰写出高质量、符合要求的材料,更好地服务于工作。目前,DeepSeek还有很多未知功能未被挖掘运用,接下来我一定不断坚持学习,发现更多辅助功能并运用到生活学习中。

关于DeepSeek,误读与幻觉

经济观察报记者周悦

(2025年2月10日)

过去几周,深度求索(DeepSeek)在全球范围掀起风暴。

最明显的反映在美股:1月27日,美股AI、芯片股重挫,英伟达收盘大跌超过17%,单日市值蒸发5890亿美元,创下美国股市历史上最高纪录。

在一些自媒体和公众的视角里,DeepSeek是“2025年最燃爽文主角”,有

四大“爽点”:

一是“神秘力量弯道超车”。DeepSeek是一家成立于2023年的“年轻”大模型公司,此前的讨论度不及海内外任何一家大厂或者明星初创公司,其母公司幻方量化的主业为量化投资。很多人不解,中国领先的AI公司竟然出自一家私募,可谓“乱拳打死老师傅”。

二是“小力出奇迹”。DeepSeek-V3模型的训练成本约为558万美元,不到OpenAIGPT-4o模型的十分之一,性能却已接近。这被解读为DeepSeek颠覆了AI行业信奉的“圣经”——规模定律(ScalingLaw)。该定律是指通过增加训练参数量及算力来提升模型性能,通常意味着花更多钱标注高质量数据以及购买算力芯片,又被形象地称为“大力出奇迹”。

三是“英伟达护城河消失”。DeepSeek在论文中提到,采用定制的PTx(并行线程执行)语言编程,更好释放底层硬件的性能。这被解读为DeepSeek“绕开英伟达CUDA运算平台”。

四是“老外被打服了”。1月31日,一夜之间英伟达、微软、亚马逊等海外AI巨头都接入了DeepSeek。一时间,“中国AI反超美国”“OpenAI的时代结束了”“AI算力需求就此消失”等论断层出不穷,几乎一边倒地夸赞DeepSeek,嘲讽硅谷的AI巨头们。

不过,资本市场的恐慌情绪并未持续。2月6日,英伟达市值重回3万亿美元,

美股芯片股普遍上涨。此时再看前述四大“爽点”也多半是误读。

其一,到2017年底,幻方量化几乎所有的量化策略都已经采用AI模型计算。

当时AI领域正在经历最重要的深度学习浪潮,可以说,幻方量化紧跟前沿。

2019年,幻方量化的深度学习训练平台“萤火二号”已经搭载了约1万张英伟达A100显卡。

1万卡是自训大模型的算力门槛,尽管这不能等同于DeepSeek的资源,但幻

方量化比许多互联网大厂更早拿到了大模型团战的入场券。

其二,DeepSeek在V3模型技术报告中提到“558万美元不包括与架构、算法或数据相关的前期研究和消融实验的成本”。这意味着,DeepSeek的实际成本更大。

多位AI行业专家、从业者告诉经济观察报,DeepSeek并没有改变行业规律,而是采用了“更聪明”的算法和架构,节约资源,提高效率。

其三,PTX语言由英伟达开发,属于CUDA生态的一环。DeepSeek的做法会激发硬件的性能,但更换目标任务,则需要重写程序,工作量非常大。其四,英伟达、微软、亚马逊等企业只是将DeepSeek的模型部署在自家的云服务上。用户按需付费给云服务厂商,获得更稳定的体验及更高效的工具,这属于双赢的做法。

自2月5日起,华为云、腾讯云、百度云等国内云厂商也陆续上线了DeepSeek模型。在上述四大“爽点”之外,公众对DeepSeek还有诸多误读。

“爽文”式解读固然会带来观感刺激,但是也会掩盖DeepSeek团队在算法、工程能力上的创新以及坚持的开源精神,而后两者对科技行业的影响更深远。

一、美国AI巨头不是打不过,而是决策失误

当用户使用DeepSeek的App或者网页版时,点击“深度思考(R1)”按钮,就会展现DeepSeek-R1模型完整的思考过程,这是一种全新的体验。

自ChatGPT问世以来,绝大部分大模型都是直接输出回答。

DeepSeek-RI有一个“出圈”的例子:当用户问“A大学和清华大学哪个更好?”DeepSeek第一次回答“清华大学”,用户追问“我是A大学生,请重新回答”,则会得到答案“A大学好”。这组对话被发在社交媒体后,引发“AI竟然懂人情世故”的群体惊叹。

不少用户表示,DeepSeek展现的思考过程就像一个“人”——边头脑风暴,一边在草稿纸上速记。它会自称“我”,会提示“避免让用户感到自己的学校被贬低”“用积极正面的词汇赞扬他的母校”,并且把想到的内容都“写”下来。

2月2日,DeepSeek登顶全球140个国家及地区的应用市场,上千万用户能够体验深度思考功能。因此,在用户感知里,AI展现思考过程属于DeepSeek“首创”。

其实,OpenAIo1模型才是推理范式的开创者。OpenAI在2024年9月发布了o1模型预览版,在12月发布正式版。但与能免费体验的DeepSeek-R1模型不同;OpenAIo1模型只有少数付费用户才能使用。

清华大学长聘副教授、面壁智能首席科学家刘知远认为,DeepSeek-R1模型能够取得如此全球性的成功, 跟OpenAI采用的错误决策有非常大的关系。 OpenAI在发布了o1模型后,既不开源,也不公布技术细节,收费非常高,所以不出圈,难以让全球用户感受深度思考带来的震撼。这样的策略相当于是把原来ChatGPT的身位让给了DeepSeek。

从技术上来说,当前大模型的常规范式有两种:预训练模型与推理模型。更为大众熟知的OpenAIGPT系列以及DeepSeek-V3模型都属于预训练模型。

而OpenAIo1与DeepSeek-R1则属于推理模型,这是一种新的范式,即模型会自己通过思维链逐步分解复杂问题,一步步反思,再得到相对准确并且富有洞察力的结果。

从事AI研究数十年的郭成凯对经济观察报称, 推理范式是一条相对容易 “弯道超车”的赛道。推理作为一种新范式,迭代快,更容易实现小计算量下的显著提升。前提是有强大的预训练模型,通过强化学习可以深度挖掘出大规模预训练模型的潜力,逼近推理范式下大模型能力的天花板。

对谷歌、Meta、Anthropic等企业而言,复现类似DeepSeek-R1的推理模型并非难事。但是,巨头争霸,即便是小的决策失误,也会错失先机。

显 而 易 见 的 是 , 2 月 6 日 , 谷 歌 发 布 了 一 款 推 理 模 型GeminiFlash2.0Thinking,价格更低、上下文长度更长,在几项测试中表现优于R1,但并未掀起像DeepSeek-R1模型一样的巨浪。

二、最值得讨论的不是低成本,而是技术创新和“诚意满满”的开源

一直以来,对DeepSeek最广泛的讨论都是关于“低成本”,从2024年5月

DeepSeek-V2模型发布以来,这家公司就被调侃为“AI届拼多多”。

《自然》杂志发文称,Meta训练其最新人工智能模型Llama3.1405B耗资超过6000万美元,DeepSeek-V3训练只花了不到十分之一。这表明,高效利用资源比单纯的计算规模更重要。

一些机构认为DeepSeek的训练成本被低估。AI及半导体行业分析机构SemiAnalysis在报告中称,DeepSeek预训练成本远非该模型的实际投入。据该机构估算,DeepSeek购买GPU的总花费是25.73亿美元,其中购买服务器的费用

为16.29亿美元,运营费用为9.44亿美元。

但无论如何,DeepSeek-V3模型的净算力成本约558万美元,已经十分高效。

在成本之外,让AI行业人士更加振奋的是DeepSeek的独特技术路径、算法创新及开源的诚意。郭成凯介绍,当前的许多方法依赖大模型经典训练方式,如监督微调(SFT)等,这需要大量标注数据。DeepSeek提出了一种新方法,即通过大规模强化学习(RL)方法提升推理能力,相当于开辟了新的研究方向。此外,多头潜在注意力(MLA)是DeepSeek大幅降低推理成本的关键创新,大幅降低了推理成本。

清华大学教授、清程极智首席科学家翟季冬认为,DeepSeek最让他印象深刻的是混合专家架构(MoE)的创新,每一层有256个路由专家、1个共享专家。之前的研究有AuxiliaryLoss(辅助损失)的算法,会使梯度发生扰动,影响模型收敛。DeepSeek提出LossFree方式,既能让模型有效收敛,同时还能实现负载均衡。

翟季冬强调:“DeepSeek团队比较敢于创新。我觉得不完全追随国外的策

略、有自己的思考,非常重要。”

更让AI从业者兴奋的是,DeepSeek“诚意满满”的开源,为已经略有颓势

的开源社区注入了一剂“强心针”。

在此之前,开源社区最有力的支柱是Meta的4000亿参数模型Llama3。但不少开发者告诉经济观察报,他们体验后仍觉得,Llama3与闭源的GPT-4等模型相距至少一代“,但是DeepSeek的开源做了3件事,重新给了开发者以信心:几乎让人失去信心”。

其一,直接开源了671B的模型,并发布了多个流行架构下的蒸馏模型,相

当于“好老师教出更多好学生”。

其二,发布的论文及技术报告包含大量技术细节。V3模型和R1模型的论文分别长达50页和150页,被称为开源社区里“最详细的技术报告”。这意味着拥有相似资源的个人或企业可以按照这一“说明书”复现模型。众多开发者在阅览后评价为“优雅”“扎实”。

其三,更值得一提的是,DeepSeek-R1采用MIT许可协议,即任何人都可以自由地使用、修改、分发和商业化该模型,只要在所有副本中保留原始的版权声明和MIT许可。这意味着用户可以更加自由地利用模型权重和输出进行二次开发,包括微调和蒸馏。

Llama虽然允许二次开发和商用,但是在协议中添加了一些限制条件,例如Llama在授权许可中对月活7亿以上的企业用户额外限制,并且明文禁止使用Llama的输出结果去改善其他大模型。

一位开发者告诉经济观察报,他从DeepSeek-V2版本就开始使用,进行代码生成方面的开发。DeepSeek模型除了价格非常便宜外,性能也非常优异。在他使用的所有模型里,只有OpenAI和DeepSeek的模型能够输出有效逻辑列到30多层。这意味着专业程序员借助工具可以辅助生成30%—70%的代码。

多位开发者向经济观察报强调了DeepSeek开源的重要意义,在此之前,行业内最领先的OpenAI和Anthropic公司都像是硅谷的贵族。DeepSeek把知识开放给所有人,变得平民化,这是一种重要的平权,让全世界开源社区的开发者站在DeepSeek的肩膀上,而DeepSeek也能汇集全球最顶尖的创客、极客的想法。

图灵奖得主、Meta首席科学家杨立昆认为,对DeepSeek崛起的正确解读,应是开源模型正在超越闭源模型。

三、DeepSeek很好,但并非完美

大模型都逃不过 “幻觉” 问题, DeepSeek也不例外。 一些用户表示, DeepSeek由于表达能力和逻辑推理更出众,产生的幻觉问题更加让人难以识别。

一位网友在社交媒体上称,他向DeepSeek提问某城市的路线规划问题。DeepSeek解释了一些原因,列举出一些城市规划保护条例及数据,并摘取了一个“静默区”的概念,让回答看起来很有道理。

同样的问题,其他AI的回答则没有这么高深,人能够一眼看出是在“胡说

八道”。

这位用户查看了该保护条例后,发现全文根本没有“静默区”这一说法。

他认为:“DeepSeek正在中文互联网建造‘幻觉长城’。”

郭成凯也发现了类似的问题,DeepSeek-R1的回答会把一些专有名词“张冠李戴”,尤其是开放式问题,产生的“幻觉”体验会更严重。他推测可能是模型的推理能力过强,把大量知识与数据潜在联系在一起。

他建议使用DeepSeek时打开联网搜索功能,并重点查看思考过程,人为干预和纠正错误。此外,使用推理模型时,尽可能使用简洁的提示词。提示词越长,模型联想的内容就多。

刘知远发现,DeepSeek-R1经常会使用一些高端词汇,典型的如量子纠缠和熵增熵减(会用在各个领域)。他猜测是强化学习中某种机制设置导致的。此

外,R1在一些通用领域没有groundtruth(指为该测试收集适当的客观数据的过

程)的任务上的推理效果还不理想,强化学习的训练并不能保证泛化。

在“幻觉”这一常见的问题之外,还有一些持续性的问题有待DeepSeek解决。

一方面是“蒸馏技术”可能带来的持续纠纷。模型或知识蒸馏通常涉及通

过让较强的模型生成响应来训练较弱的模型,从而提高较弱模型的性能。

1月29日,OpenAI指控DeepSeek利用模型蒸馏技术,基于OpenAI的技术训练自己的模型。OpenAI称,有证据表明DeepSeek使用其专有模型来训练自己的开源模型,但没有进一步列举证据。OpenAI的服务条款规定,用户不能“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。

郭成凯认为,基于领先模型蒸馏验证优化自己的模型,是很多大模型训练的一个普遍操作。DeepSeek已经开源了模型,再进行验证是一件简单的事情。而OpenAI早期的训练数据本身就存在合法性的问题,如果要对DeepSeek采取法律手段,则须上升到法律层面维护其条款的合法性,并且要更明确其条款内容。

DeepSeek另一有待解决的问题是如何推进更大规模参数的预训练模型。在这方面,掌握更多优质标注数据、更多算力资源的OpenAI尚未推出GPT-5这一更大规模参数的预训练模型,DeepSeek是否能继续创造奇迹,还是个疑问。

无论如何,对DeepSeek产生的幻觉,同样由好奇心所激发,这或许正是创新的一体两面。正如其创始人梁文锋所言:“创新不完全是商业驱动的,还需要好奇心和创造欲。中国的AI不可能永远跟随,需要有人站到技术的前沿。”

永州市政务迈入AI时代DeepSeek私有化大模型赋能政务服务(2025年2月28日)

“以前填表要花很长时间,现在扫一下证件就搞定了,真是太方便了!”前来办理营业执照变更的李女士对新的智能填表系统赞不绝口。2025年2月27日,永州市在政务服务中心完成DeepSeek大模型系统的本地化部署,此次部署以提升服务效率、保障数据安全为核心,通过智能填表、热线客服、导办系统三大场景的全面升级,推动永州市政务服务迈入智能化新阶段。

一、智能填表:效率倍增的政务革新

传统政务服务中,市民办理业务需手动填写表格,单次耗时约30分钟。DeepSeek系统上线后,通过证件扫描与信息自动识别技术,表格填写时间压缩至5分钟以内,效率提升6倍。以不动产变更为例,市民仅需扫描证件即可完成信息录入,系统同步校验数据准确性,避免人工失误。市民反馈显示,流程简化显著提升了办事体验,高频业务窗口的排队时长同步下降60%。

二、12345热线:AI客服驱动服务质变

永州市12345政务服务热线引入DeepSeek智能客服后,实现诉求理解、工单生成、服务指引全流程自动化。系统通过自然语言处理技术精准解析市民需求,工单分类准确率达98%,平均处理时长缩短60%。此外,智能客服支持24小时不间断服务,高峰期话务承载能力提升3倍。

三、智能导办:全场景覆盖的精准服务

在永州市政务服务大厅内部署的智能导办系统,依托DeepSeek大模型生成最优办理路径,结合语音交互功能为特殊群体提供无障碍服务。市民输入办理事项后,系统自动规划窗口导航、材料预审及流程提示,窗口资源调配效率提升30%。数据显示,导办系统上线后,大厅日均业务处理量增加20%,窗口人员工作负荷降低15%。

据悉,此次部署是永州市数据局联合永州移动在智慧政务领域的一次积极探索。项目采用本地化部署模式,数据全程在永州政务云平台内闭环处理,确保敏感信息零外泄。技术架构上,系统兼容国产芯片与服务器,实现从基础设施到应用层的全栈自主可控。下一步,永州市计划以此次DeepSeek私有化部署为契机,进一步推动AI技术在医疗、教育、交通等领域的创新应用,助力永州数字化转型和高质量发展。

DeepSeek大模型赋能石油化工行业—石化央企引领AI与能源融合新浪潮

杨晓宇

2025年2月,一场意义深远的技术革命席卷中国石油化工行业。随着国产深度推理大模型DeepSeek的全面落地,中国石油、中国石化、中国海油、中国中化等央企迅速行动,率先完成全尺寸模型部署。这一标志性举措正式宣告石油化工行业步入智能化转型的关键阶段。DeepSeek大模型的应用,不仅将提升生产效率,革新行业认知能力,更为全球能源行业的人工智能应用树立了全新标杆。

一、技术突破:国产化部署实现效率飞跃

自2025年1月DeepSeek发布以来,中国石化展现出高效的行动力,迅速组建专项团队。在短短10天内,成功将该模型部署于国产化算力环境中,并顺利接入“长城大模型应用系统”。在此过程中,通过对推理加速技术的精心优化,模型的计算效率近乎提升一倍,极大地增强了其在复杂工业场景下的实时响应能力,有力地打破了技术瓶颈。

为精准验证DeepSeek-R1在石油化工领域的适用性,中国石化精心编制了《石油化工行业大模型测试题集(推理思考版)》。测试结果令人瞩目,该模型对行业知识理解的综合准确度高达92%。尤其在数学公式解析、化学结构式识别以及专业图表分析等关键场景中,表现尤为突出,为后续行业数据集的构建和模型训练提供了坚实可靠的支撑。

中国石油的昆仑大模型也于2月8日正式完成了DeepSeek大模型的私有化部署。这一举措为昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎。在应用层面,昆仑大模型的问答应用“行业大家”新增了DeepSeek深度推理能力,使用户能够以更专业的角度进行行业问答。同时,昆仑大模型的AI中台模型广场已上线DeepSeek-V3与DeepSeek-R1模型版本,并实现全尺寸适配,满足不同场景的需求。

而中国海油则于2月14日宣布其“海能”人工智能模型平台正式接入DeepSeek系列模型,并通过私有化部署方式面向全集团提供开放服务。这一升级不仅为海油在人工智能领域的应用打下了坚实基础,也确保了企业数据的安全性。DeepSeek系列模型将通过API接口面向海油ERP系统、海油商城等多个应用系统开发服务,全方位、多层次满足不同业务场景的智能化需求。

中国中化在人工智能领域也迈出了坚实的步伐。2月13日,中国中化宣布,

其人工智能平台成功接入DeepSeek系列模型,包括DeepSeek-R1和DeepSeek-V3等,采用私有化部署方式,依托专属智算资源池,完成了DeepSeek-R1671B完整版本以及多个蒸馏版模型的部署,并通过API接口面向集团各单位应用系统开放调用。

二、应用场景多元拓展:全方位赋能石油化工产业链

业内人士普遍认为,DeepSeek大模型的应用在推动效率革命与生态重构方

面,将对行业产生了极为深远的影响。

石油化工行业作为资本与技术密集型产业,运营成本高昂,能源消耗巨大。DeepSeek大模型的全面应用,犹如为行业发展装上了强劲的引擎,带来了显著的降本增效成果。据专业测算,DeepSeek的全面应用有望使石油化工企业的综合运营效率提升20%~30%,能耗降低10%~15%。以中国石化为例,其年炼油产能超3亿吨,仅蒸汽消耗优化一项,每年即可节省数十亿元成本。

在化工产品研发领域,DeepSeek凭借其强大的智能解析能力,成为了加速创新的“助推器”。北京化工大学教授辛春林表示,DeepSeek开源模型的社区协作机制还加速了技术的迭代和创新。具体到新材料研发领域,DeepSeek可以通过高效文献检索与知识整合,快速获取最新的研究成果和技术信息,帮助研究人员了解行业前沿动态,启发创新思路。同时,DeepSeek还可以协助进行实验方案优化与预测,为研究人员提供优化的实验方案和预测结果,提高研发效率和成功率。

DeepSeek通过对全球能源价格走势、宏观经济数据、地缘政治局势以及区域市场需求等多维度数据的深入分析,能够精准预测市场趋势。企业基于这些预测结果,可以更加科学地优化库存配置,合理安排生产和运输计划。

石油化工行业长期生产运营积累了海量数据,但因缺乏有效管理与标准化体系,数据价值未得到充分挖掘与释放。DeepSeek大模型凭借强大的智能解析与标注能力,为行业数据资产标准化建设提供有力支持。

有分析人士指出,DeepSeek在国内石油化工行业成功落地,未来如能广泛应用,其卓越性能与显著成果必将吸引全球能源领域关注,尤其是沙特等能源大国。这些国家在能源行业资源丰富、实力雄厚,但在人工智能技术与能源产业深度融合方面,仍在积极探索突破。中国石化企业与DeepSeek的合作模式,为“AI+能源”全球化发展提供极具价值的范例。这种合作模式未来有望在国际市场广泛推广应用。中国可通过技术输出,将DeepSeek及相关应用解决方案推

广到其他国家和地区,助力其提升能源行业智能化水平。这不仅有助于拓展中

国企业国际市场份额,还推动中国技术标准走向国际舞台。

三、直面挑战积极应对:稳步推进智能化转型

不过,石化央企在接入DeepSeek大模型时,仍面临一定的风险和挑战。相关挑战主要集中在技术适配、数据安全、行业应用、生态建设、市场竞争以及政策环境等方面。

一方面,还需攻克技术适配与生态短板。尽管国产GPU性能不断提升,但在算力密度和软件生态方面,与国际领先产品仍存在一定差距。中国石化技术团队通过定制化开发,成功解决了DeepSeek在国产硬件环境中的兼容性问题。不过,从长远来看,仍需持续加强底层技术攻关,以实现技术的自主可控和可持续发展。

另一方面,还需筑牢数据安全与隐私保护防线。石油化工行业涉及大量敏感的地质和生产数据。为此,央企需构建全方位覆盖数据全生命周期的安全防护体系,包括本地化部署、动态加密传输以及权限分级管理等措施,确保核心数据的安全,做到核心数据不出域。未来,在数据处理和模型应用中,相关能源央企需确保技术方案符合相关法律法规的要求。

此外,复合型人才缺口也是企业面临的挑战之一。业内人士表示,智能化转型对既精通AI又熟悉化工的复合型人才需求急剧增长,未来石化企业对于复合型工程师的要求将越来越多,企业应联合高校开设“AI+能源”人才培训计划,为行业智能化发展提供坚实的人才保障。

展望2025年,DeepSeek将进一步拓展至炼化工艺优化、碳排放监测等新场景。业内人士建议,石化企业应联合起来共同推动DeepSeek与行业模型的协同训练,形成覆盖勘探、生产、研发的全链条智能生态,提升行业整体竞争力。

“DeepSeek+政务”热潮彰显技术赋能强大力量

洪观新闻记者万磊

(2025年2月20日)

近一个月以来,DeepSeek大模型以惊人的速度在全国多地政务服务系统中落地,犹如一场“闪电战”。从热线应答的智能化升级,到公文处理的自动化,再到民生服务等多元场景的深度应用,AI技术正以前所未有的广度重塑政务服务生态。这场效率革命的浪潮,彰显了技术赋能的强大力量,也促使人们重新审视政务智能化转型的方向与意义。

“DeepSeek+政务”的上线,首先带来的是政务服务效率的显著提升。以南昌为例,通过DeepSeek大模型的智能问答、智能填表和智能审批功能,市民和企业办理业务的时间大幅缩短。以往需要多次跑腿、反复提交材料的繁琐流程,如今只需在“南事好办”平台上动动手指即可完成。

DeepSeek的应用场景正在从单一的热线应答向多元领域延伸。在公文处理中,AI实现了智能写作和快速审批;在民生服务中,智能问答和智能填表功能让群众办事更加便捷;在应急管理中,大数据分析和预警系统提升了响应速度。这种多元融合的应用模式,展现了AI技术在政务服务中的广阔前景。

AI技术的引入,无疑为政务服务带来了效率革命,但技术并非万能。AI处理的是重复劳动,而人类守护的是人性温度。政府部门在拥抱AI技术的同时,也需注重人性化服务的提升,确保技术应用既高效又温暖。

效率革命需以群众获得感为“标尺”。DeepSeek大模型的快速部署,展现了政务服务智能化转型的巨大潜力。然而,这场效率革命的意义,不仅在于技术的先进性, 更在于能否真正提升群众的获得感。 唯有以群众满意度为 “标尺” ,才能真正实现政务智能化加速转型。

侠客岛对话郑永年:DeepSeek带来的震撼与启示

侠客岛:今年春节前后,中国AI公司深度求索(DeepSeek)的大模型

DeepSeek-R1火爆全网,很多人被它展现出来的强大能力震撼,您有没有使用?

郑永年:过年期间大家都被DeepSeek淹没了,我也试过了。之前我用过ChatGPT, 确实体验到人工智能大模型一直在不断进步。 这次DeepSeek引发热潮,是“开源的胜利”。

侠客岛:很多外媒报道DeepSeek。有的说这证明了大投入、拼芯片数量的AI道路不再是唯一之路;另一些戴着有色眼镜的则说这是威胁,美国一些机构还禁止员工下载使用。您怎么看待这些现象?

郑永年:这都是把它标签化,关键是从哪个层面看问题。此前,像ChatGPT等大模型让美国处于垄断地位,可以“价格自定”。垄断地位带来的芯片价格、大模型的估价等,本就有大量泡沫。当中国的DeepSeek出现,大家才发现,原来大模型也不一定需要那么高成本、那么多芯片。相关公司和资产的价格自然就会下调。

对美国某些政客来说,可能会带来恐惧。在DeepSeek出现之前,他觉得几乎所有人工智能领域的尖端竞争,都是在美国公司之间展开的,而不是在中国公司跟美国公司之间,但DeepSeek证明事实并不如此。

对美国科学界,我觉得倒没那么大冲击。因为这些人相信,只要是开源的,就一定会被超越,技术总是不断进步的。中国的进步就是建立在开源之上。DeepSeek选择把技术论文等开源,其他国家的开发者也可以很快去验证,在他们的基础上做调整和进步。如此往复循环、不断更新进步,才是科学的逻辑。

这跟资本垄断定高价的逻辑、政治封闭以求领先的逻辑,存在根本性不同。

侠客岛:DeepSeek是否完全走出了一条新路?这对中国,对那些被美国排除在“核心盟友圈”、缺乏资金和足够获取先进芯片能力的国家来说,是不是具备更强的战略意义?毕竟拜登下台前还搞了个芯片出口管制法案,弄出三个圈层,用意就是限制、削弱他国与之竞争的能力。

郑永年:条条大路通罗马。以前说一定要大量的资本才能干成什么事,这是资本的逻辑,实际上并不一定是那么回事,是资本在制造自己的神话。但问题是以前没人挑战他,有人挑战,局面就不一样了。如果只有一家银行,大家只能把钱投到这里,它随便说了就算。有了第二个替代性可选方案,神话就会被戳破。

同样,DeepSeek是创新,但不是完全另辟蹊径,我把它称为“里程碑式的改进版”。如果完全是另辟蹊径,别人就很难复制得了,自己也可能成为新的垄断,自我封闭起来。实际上DeepSeek和美国一些大模型走的是同一个方向,但证明了有其他的路径可以通往这个方向。DeepSeek对中国最大的启示,我想还是“开放”二字。无论是心态上还是方法上,都要毫不动摇地坚持开放,继续开放。DeepSeek的胜利,就是开源打败闭源。OpenAI以前是开源的,后来变成闭源的,这次DeepSeek爆火之后,OpenAI的奥特曼也出来说话,承认闭源是一种战略错误。

为什么必须开源?因为任何一种科技都有可以改进的地方,不是封闭系统。技术总有各种各样的小错误,怎么发现并改进?三个臭皮匠顶个诸葛亮。你哪怕最聪明,也不一定看得到有些错误;人多了,大家都盯着看,就能找到毛病。技术发展的路径就是这样,在开源—创新—迭代的循环中螺旋前进,持续参与全球性的技术竞争、创新改进,才可能不断取得超越、成功。中国的新能源、AI等领域都是这样走过来的,是开源基础+中国智慧的结晶。

开源不仅可以用我们举国的力量,还可以用全世界的力量。世界的科学共同体要联合起来,遏制资本、遏制某些政客的力量,促进人类的技术进步。中国过去很多技术成果和产业成功都是在开放条件下取得的,今后也必须如此。

侠客岛:还有一个有意思的现象,包括DeepSeek,包括春晚上扭秧歌机器人的宇树科技,它们都在杭州,有“杭州六小龙”之说。这些公司的创始人、员工都非常年轻。从城市生态、人才聚集的角度来说,这代表了怎样一种方向?

郑永年:人类进入互联网时代以后,“大玩家”只有中美,人工智能也是如此。

中美两个国家之内很典型的趋势是城市群。美国人工智能有两块,一块是硅谷到得克萨斯,所谓“狭长地带”;另一块是波士顿到纽约,东北部这一块。中国也有两块,一块就是长三角,苏州、上海、杭州一带;另外是粤港澳大湾区,广州、深圳这一块。北京基础科研很好,但是技术应用往往还得往这俩地区跑。

生态最重要。我常说“三驾马车”,基础科研、应用技术、金融,缺一不可。杭州做得确实好,我将其称为“地域嵌入型”的生态环境,人才、资金等各种要素都已经在这里面了,所以就有利于创新,也有利于吸引年轻人。

美国硅谷,IT最发达,互联网最发达,但是它周围的基础设施就很差。中

国基础设施是政府负责,像杭州余杭区、滨江新区,那种大规模的基础设施建

设,不是私营公司能做到的。中国是政府和市场两条腿走路。

还有一个特别重要的因素:浙江有很大的中等收入群体,“中产社会”非常大。只有“中产社会”才会去做这种有风险的、长期创新性的投资。

至于人才,围绕浙江大学的产学一体化,特别是浙江杭州这一块,有点像美国斯坦福大学周边,产业体系做得很好。人才观念很重要。杭州这些“六小龙”都是年轻人,这就提醒政府,高科技时代,投资一定要向年轻人倾斜。人才也是个系统工程。

其实,长三角、珠三角还有很多有潜力成为独角兽的企业,很多人没有资源,但是有技术,需要来自国家的资源。所以,科技要取得长足进步,金融改革也要跟上。我们不要虚拟金融、泡沫金融,要遏制投机性的,但对新技术的投资、对真正创新的风投,我们一定要做好。

我们正在产生大量的新质生产力,但如果是因为体制机制改革没跟上,导致一些新质生产力落不了地,那就太可惜了。这方面还有很大改革空间。

“牵手”DeepSeek央企“AI+”行动提速

经济参考报记者王璐

(2025年2月24日)

近来,国资央企“牵手”DeepSeek已成为一股新风潮。据《经济参考报》记者不完全统计,目前有超20家央企接入DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领域。业内人士指出,这一系列动作的背后是国资央企全面开展“AI+专项行动”,加速探索人工智能深度应用到丰富多样的生产场景。国务院国资委近日召开中央企业“AI+”专项行动深化部署会。会上发布了国资央企“AI+”专项行动实施要点,启动了战略性高价值场景建设专项工作。会议要求,中央企业在编制企业“十五五”规划中要将发展人工智能作为重点,打造更多科技领军企业,孵化培育一批初创企业。要加大相关资金投入,持续壮大发展人工智能产业。要优化人才引育,建立更加符合行业特点规律的人才评价体系。

一、密集接入DeepSeek

“现在央企都在研究DeepSeek,我们初步做了一些测试,专业度和准确度还是可以的,能够支撑行业数据集建设和行业模型训练。”一位石化央企人士告诉记者。

近日,中国石化、中国石油、中国海油、中国中化、国家能源集团、中国核电、中广核、华能集团、国家电投、华电集团、南方电网等多家能源企业相继宣布,已完成DeepSeek大模型私有化部署,全面接入企业自有的AI大模型。

“目前能源央企已经落地多个AI大模型应用,推动智能化转型。接入DeepSeek,可以提供更多的智能化解决方案。”中国企业改革研究会研究员周丽莎说。

例如,中国中化表示依托DeepSeek在复杂信息处理、逻辑推理、开放域知识理解等方面的突出能力优势,平台将更好满足不同业务场景的智能化需求,全方位、多层次助力中国中化核心业务智能化转型升级。

南方电网引入DeepSeek大模型,基于“大瓦特”模型体系开放技术路线,实现了自然语言(NLP)基础模型快速升级迭代为千亿参数级。同时,通过深度整合DeepSeek的算法优化等创新能力,将进一步提升南方电网各业务领域人工智能应用效果。

事实上,在此之前,通信领域三大运营商也已率先布局。中国移动已全面

接入DeepSeek-R1模型,提供专属算力方案,应用于智能客服、云计算等场景;中国电信天翼云成为国内首家支持DeepSeek-R1模型的云服务商,实现全栈国产化推理服务落地;中国联通基于“星罗”平台适配DeepSeek-R1模型,应用于联通云桌面、编程助手等场景。

汽车、金融、科技、建筑等领域的央企同样积极拥抱DeepSeek。例如,东风汽车旗下自主品牌完成DeepSeek全系列大语言模型接入,该模型即将应用于东风岚图、东风猛士、东风奕派等公司旗下自主品牌车型。中国能建近日完成DeepSeek系列模型全平台接入与私有化部署,深度融入自主研发的“能AI”助手,实现人工智能全面赋能,数字化转型取得新突破。

二、深度结合觅新机

全面接入只是央企拥抱DeepSeek的一个开始。有业内人士表示,如何将DeepSeek的通用化技术方案与具体业务需求深度结合,仍需要大量定制化开发和测试。

中广核AI平台目前已成功上线13个典型应用。本次完成DeepSeek模型接入后,将对DeepSeek进行训练,用户可以根据业务的实际需求在中广核AI平台选择合适的大模型来完成业务任务。

中国石化表示,下一步,将进一步完善集团人工智能技术体系,提升石油化工行业大模型的训练质量,实现深度推理与行业认知的深度融合。同时,将充分利用DeepSeek大模型的高质量编程能力,提升地震资料处理、油藏开发优化、化工产品研发、客户服务等专业模型的开发效率,进一步推动石油化工行业向智能化、数字化转型。

“DeepSeek出现实现了AI平权,未来AI竞争就是数据规模和质量,央企拥有庞大的数据资源,与DeepSeek结合后,数据流通与市场化进程加速。”周丽莎表示,汽车行业的大模型,可用于企业数据分析和智能决策,提升智能驾驶和车载交互能力。交通与物流领域等央企也可能会利用AI技术优化交通基础设施建设、物流配送路线规划、智能仓储管理等。科技与通信领域央企可能会与DeepSeek合作,推动人工智能在通信技术、网络安全、智能办公等领域的应用。

中信证券研报认为, 运营商凭借高质量的智算中心和算网平台, 为DeepSeek的部署、推理及微调提供支持,未来有望通过调用智算中心资源,显著提升云计算和AI业务的收入,增强新兴业务盈利能力。接入DeepSeek后,通信运营商在智慧城市、工业互联网、客户服务等场景的应用潜力被看好,有望加速技术

商业化进程。

三、“AI+”专项行动提速

加速布局AI大模型是国资央企带头抢抓人工智能赋能传统产业机遇的一个缩影。

人工智能是新一轮科技革命和产业变革的重要驱动力。2024年以来,国资委多次“点题”人工智能,央企“AI+”专项行动全面实施,发布了“九天”“星辰”等通用大模型和一批行业大模型。推动AI在健康、建筑、冶金等12个重点行业、400余个场景落地应用。

国务院国资委强调,国资央企要抓住人工智能产业发展的战略窗口期,强化科技创新,聚焦关键领域加快掌握“根技术”,坚定攻关大模型,积极参与开放生态建设,推动产生更多“从0到1”的原始创新,加速推进成果转化和产业化发展。要强化深度赋能,瞄准战略意义强、经济收益高、民生关联紧的高价值场景,强化行业协同、扩大开放合作,加大布局突破力度。要夯实算力基座,为技术突破、应用落地提供有力支撑。要突破数据难题,分批构建重点行业数据集,建设好通用基础数据集,做强做优数据产业。

众多企业也提出了各自的明确目标。例如,中国海油表示将密切关注和跟踪国际人工智能前沿技术发展趋势,加强与中国电信、科大讯飞等专业公司的务实合作,力争“十四五”末中国海油整体数字化率达到50%,“十五五”末达到80%以上,为加快创建世界一流示范企业升级“智能引擎”。

中国华能称将基于国产算力底座、平台和模型,依托丰富的应用场景优势和数据优势,加速构建数智华能生态,系统化、专业化、平台化开展“人工智能+”专项行动,建设全面、丰富的高质量数据集,发布具有华能特色的行业大模型,构建体系化人工智能应用能力,大力推广人工智能在各业务板块的应用,为新型电力系统和新型能源体系建设提供强有力的数智化支撑。

在周丽莎看来,中央企业在人工智能平台建设方面展现出强劲的投入与合作态势,通过自主研发、行业大模型开发、对外合作及政策支持,逐步构建起覆盖多领域的AI技术生态。实施“AI+”专项行动国企可以优化生产流程、提升管理效率,推动产业链向高端化、智能化发展。

国务院国资委研究中心研究员胡迟提醒,推动“AI+”专项行动,要与各个行业的技术特点、目前的技术水平阶段相结合,不可“一哄而上”、“一刀切”,不切实际地盲目上项目,需要根据行业、企业的具体情况考虑。

DeepSeek“破圈”意味着什么

光明日报调研组(2025年2月28日)

中国人工智能技术普惠发展让各国共享智能红利这一个月,DeepSeek成为

席卷全球的“热搜”!

一度雄踞多国移动应用商店下载量榜首,广泛接入各行各业,性能堪与美国智能巨头“掰手腕”。

美国《纽约时报》。说,硅谷每个人都在关注DeepSeek。

英国《卫报》网站评价,来自中国的生成式人工智能模型DeepSeek-R1证明,最优秀的大模型可以不靠那么大的算力和那么多的资金投入。这是“颠覆性”的。

德国《时代》周报总结,这已经不是中国高科技行业第一次用创新产品征服世界了。

英国《金融时报》网站惊呼:从加利福尼亚到华尔街,人们突然急切地提出这样一个问题——中国在人工智能领域是否已经迎头赶上?

是的!仅7天,能聊天、会“推理”的DeepSeek下载量已破亿。而它,也似

一面棱镜,折射出中国这个东方大国的科技成色。

习近平总书记指出:“加快发展新一代人工智能是事关我国能否抓住新一

轮科技革命和产业变革机遇的战略问题。”

在这场人类社会崭新的重要变革中,DeepSeek“破圈”,意味着什么?在风起云涌的全球人工智能竞争中,如何定位中国的历史“坐标”?在推进共享智能普惠红利的未来中,中国人工智能产业又该如何发力?

在这闹猛的春讯中,光明日报调研组循着中国人工智能激昂跃动的“神经网络”,“深度求索”它驰奔向前的核心密码。

一、战略引领:从“晚了一个周期”到“第一梯队”

作为一项渗透性极强的颠覆性技术,今天,人工智能的“千帆竞速”几乎以周计算。不信你看,中国的DeepSeek热度未减,美国企业家马斯克发布了号称性能更好的Grok3人类,似乎正加速进入通用人工智能时代——国外,有OpenAI的GPT系列,谷歌的Gemini系列;国内,有腾讯的元宝,字节跳动的豆包,华为的盘古大模型,阿里的通义百模大战,并非夸张之语。

实事求是讲,中国是人工智能领域的后来者。

1956年,国际人工智能领域在美国达特茅斯会议上确立了学科地位,彼时的新中国却处于技术孤岛。直到20余年后,在全球人工智能迎来第二波浪潮时,东方古国的人工智能方才“萌芽”。比世界水平晚了一个周期,唯有迎头追赶。

1986年3月,一份《关于跟踪研究外国战略性高技术发展的建议》 (即“863计划”)被郑重呈递到邓小平同志的案头。在这份当年即启动的计划中,“智能计算机”被列为国家战略。

这一决策的背后,是党中央对科技趋势的敏锐判断。

进入21世纪,AlphaGo、ChatGPT不断刷新人类对人工智能有多“能”的认知,中国洞见了新一轮科技革命的端倪——2013年9月30日,中央政治局集体学习走出中南海,把“课堂”搬到了中关村。

习近平总书记在主持学习时强调,“新一轮科技革命和产业变革正在孕育兴起,一些重要科学问题和关键核心技术已经呈现出革命性突破的先兆,带动了关键技术交叉融合、群体跃进,变革突破的能量正在不断积累。”

人工智能,无疑是这一轮科技革命和产业变革的战略性技术!

2015年,《国务院关于积极推进“互联网+”行动的指导意见》出台,首次将“人工智能”纳入重点任务;2016年,“人工智能”被写入“十三五”规划纲要;2017年,《新一代人工智能发展规划》发布,设定“三步走”目标,发展人工智能上升为国家战略。

不能等待、不能观望、不能懈怠——实施科技创新2030—“新一代人工智能”重大项目,组建人工智能国家实验室,成立新一代人工智能治理专业委员会,布局建设北京、上海、深圳、杭州等18个国家新一代人工智能创新发展试验区以提升新一代人工智能科技创新能力为主攻方向,部署全方位展开。

淡蓝色的智慧屏上,实时更新的数据不断闪烁,这是记者在国家数据中心

集群(甘肃•  庆阳)“东数西算”产业园区内看到的场景。

这是我国8个国家算力枢纽节点之一。仅需1秒,这里的算力服务就可从黄

土高原直达长三角、京津冀和粤港澳。

算力是人工智能发展的核心要素和关键支撑。2022年年初,我国“东数西算”工程全面启动。仅仅3年,全国在用算力中心机架总规模已超过830万标准机架,算力总规模达246EFLOPS(每秒百亿亿次浮点运算),跃居世界前列。

福建社会科学院副院长、教授黄茂兴分析:“从技术演进史看,中国作为

后发者,在之前的人工智能浪潮中完成了技术追赶,而在大模型时代首次实现DeepSeek这样的突破,实则是中国人工智能从‘跟跑’到‘并跑’、局部‘领跑’转型的必然外显。”

“社会主义制度的优越性,就在于集中力量办大事!”中国工程院院士、鹏城实验室主任高文感慨,“经过多年的持续研发布局,我国人工智能科技创新体系逐渐完善,人工智能整体发展已进入全球第一梯队。”

二、技术颠覆:走一条“不随大流”的路

“什么时候才能出现人工智能的‘中国时刻’?”

几年前,北京通用人工智能研究院院长、北京大学智能学院院长朱松纯提出这个问题。如今,面对DeepSeek的突破,他告诉记者自己心中的答案:“我想,要交出一份满意的答卷,就要走出一条属于我们自己的路,走底层逻辑自主可控的创新之路,走不随大流、坚信人工智能的‘中国时代’必将到来的创新之路。”

什么是DeepSeek的创新之路?

“绕过人工智能大模型‘砸钱堆算力’的传统路径,他们另辟蹊径,通过算法优化,大大降低了人工智能模型的计算功耗,实现了低成本、高性能,为其他技术后发国家和地区提供了一种可复制的模式。”国家发改委产业经济与技术经济研究所创新战略室主任、研究员刘振中说。

“它让人们看到了,中国在通用人工智能领域突破技术壁垒、摆脱国际依赖、构建本土生态的巨大潜力。”深圳市人工智能与机器人研究院具身智能中心研究员王凡评价。

在人工智能公司衔远科技技术负责人李丰俭看来:“它离不开中国在人工

智能领域长期的技术积累,这是从量变到质变的过程。”

的确,经年努力,中国人工智能技术正在从“追赶式创新”向“自主创新”转变。神经网络、具身智能、专用人工智能中国人的表现同样让世界刮目相看!

在清华大学精密仪器系的一间实验室里,一排摄像头正对着液晶屏幕上不

断变换的视觉图像拍摄。

“这是类脑计算机正在进行视觉快速识别,它和我们那辆无人自行车一样,都是由天机芯片组建的系统应用。”清华大学教授、类脑计算研究中心主任施路平介绍。

此刻,这辆黑色无人自行车停在墙角,后座搭载着书包大小的机箱,可以

实现自动平衡、避障、过障、目标跟踪、语音指令识别以及自主决策。

它的大脑——天机芯片,是全球首款异构融合类脑芯片,同时支持基于神经科学的脉冲神经网络和基于计算机科学的人工神经网络,于2019年8月登上《自然》的封面。

“这是我国人工智能基础研究的一个代表。近年来,我国在人工智能领域,取得了不少原创成果,研究达到国际前沿水平。”华中科技大学认知计算与智能信息处理实验室主任、 教授魏巍说, “我们不是追风口的人, 我们是造风者。 ”

这样的造风者,还有很多。

走进中国移动“九天”人工智能团队的办公室,一台台电脑屏幕上闪烁着跳动的代码,键盘的“伴奏”声此起彼伏。

有一套磨损的键盘却很“沉默”。“这是我们第一套键盘,当时为掌握大模型的训推技术, 团队啃下500万亿字符数据, 这样的键盘, 不知用坏了多少套。 ”中国移动研究院首席科学家冯俊兰回忆。

从2013年到2025年,团队日夜不辍地提炼技术要点,边积累技术、边推进训练,最终掌握了从训练到推理的全链路技术,换来首个通信网络智能调度系统的诞生和迭代。

冯俊兰至今记得,某地4G基站瘫痪,这套人工智能调度系统把修复时间从2

小时压到70分钟。“‘神了!’现场工程师这声惊叹,让我比拿专利还骄傲。”

一组数据勾勒出中国人工智能领域的巨变——中国人工智能期刊论文发表

数量已位居全球首位,顶级会议论文产出不断逼近美国,专利申请量占全球50%

以上。

“这一切,促成了技术积累的厚积薄发。”黄茂兴说。

规模优势:发达的互联网基础设施,为人工智能“进化”奠定了基础“萝

卜,出发!”

重庆的黄女士话音刚落,车辆自动开始行驶,在这座“8D城市”中游刃有余——五层立交桥的螺旋匝道间精准变道,解放碑地下环道的狭窄通道中穿行,导航系统始终保持着厘米级定位精度。

这个被重庆市民称为“新朋友”的“萝卜快跑”,已经历过800万次真实路况的数据锤炼。在中国,千万个“萝卜快跑”正奔驰在自己的快车道上——深圳繁忙的主干道上,人工智能交通信号系统通过分析日均2500万车次数据,将平均拥堵时长降低18%;在上海瑞金医院里,AI医疗影像诊断系统通过分析超过

100万张CT影像数据,将肺部结节诊断准确率提升至95%以上。

“咕噜咕噜”。湘潭钢铁集团宽厚板厂精炼车间内,1600℃的钢水在4号钢

包炉内翻滚。

“你来看!”宽厚板厂主任黄林华轻触屏幕,20个传感器数据瀑布般倾泻而下——几年前需要老师傅贴着炉口观察的钢水成分,被人工智能预测曲线精准锁定。

望着高效运转的智能生产线,华为混合云总裁尚海峰满是欣喜:“这是我们和湘钢携手打造的全球第一个钢铁行业的人工智能大模型,下一步,要打造一个覆盖钢铁制造全流程的智能平台和标准体系。”

从珠三角的电子制造到长三角的汽车工业,从东北老工业基地的装备制造到西部能源基地的智能开采,作为全球工业门类最为齐全的国家,中国已完成人工智能在12个重点行业、400余个场景的落地应用。

更多的场景,在无法触摸到的地方。

一座城市的人工智能“大脑”,可以赋能多少个场景?

“只有想不到,没有做不到”,这是记者在DeepSeek的诞生地浙江杭州调研后得出的答案——自动发现110种警情,从发现到报警平均用时仅10秒钟;实时分析各项交通指标,红绿灯时间调控可以“对症下药”;第一时间辨认破损的路灯、窨井盖,并发出警告。

政务、 交通、 城管、 卫健多个应用场景日均协同数据高达1.2亿条, 杭州 “城

市大脑”全方位、多角度地浸润着这座城市百姓的生活。

这得益于中国数字化转型的独特基底——超419万个5G基站、11.08亿网民移动终端和超过4500家的人工智能企业,为人工智能的“进化”提供着永不枯竭的养料。

“我们有发达的互联网基础设施,城市数据资源的积累将比世界任何一个国家都快, 所以, 中国才能找到一个世界上其他国家和城市目前还没有的新路。 ”中国工程院院士、之江实验室主任王坚说。

黄茂兴对此表示赞同,中国在智慧城市、工业互联网等领域的超大规模场景,为人工智能技术提供了“试验田”,“这种‘场景反哺技术’的模式,是中国人工智能企业区别于美国硅谷纯技术驱动路径的核心竞争力。”

三、营造环境:“让创新自然生长”

成立一家人工智能研究机构,从拟订方案到落户注册,需要多长时间?不

到两个月!这是武汉的速度。

“我们研究所从建设方案拟订到落户注册, 武创院和东湖高新区全流程 ‘伴飞’ , 从提交申请到拿到营业执照仅仅4天, 让我们感受到了武汉的诚意和效率。 ”武汉产业创新发展研究院AI蛋白质设计研究所所长、复旦大学复杂体系多尺度研究院院长马剑鹏赞叹。

这样的故事正在更多城市上演。

“DeepSeek的出现,既基于其自身长期的技术积累,也有赖于创新生态的托举。”北京中科闻歌科技股份有限公司董事长王磊说,“最近,一些城市在反思为什么自己未能孵化出DeepSeek,这样的自我审视与反思是有意义的,有利于全社会思考,怎样创造更优的创新环境、培育更好的创新文化。”

调研中,脑机接口企业强脑科技合伙人何熙昱锦向记者讲述的故事,同样

耐人寻味。

几年前,一支来自杭州未来科技城的考察队,在哈佛大学脑科学中心的地下室,找到了一群心怀梦想的青年科学家。

“神经科学、传感器材料学、算法这些都是研究脑机技术需要攻克的,我们还在‘摸着石头过河’,他们却送来了一条‘船’。”何熙昱锦至今记得,考察队邀请他们入驻杭州,给予租金减免等优惠,提供“保姆式”创新服务。

3年后,强脑科技的消费级产品——智能仿生手下线量产,成就“全球首个便携式高精度脑机接口产品10万台量产”。

“在大家对脑机接口还没有那么多认知的时候,地方政府感兴趣,愿意了

解,愿意支持,着实让我们惊喜!”何熙昱锦说。

中国人民大学中国就业研究所研究员李志龙认为,在人工智能等前沿颠覆性创新领域,政府就是要更多扮演“园丁”角色,营造良好的环境,“让创新自然生长”。

轻轻点开手机上的“MODI摹小仙”小程序,北京一家母婴用品店的导购王莉根据选题推荐,点击创作按钮,只需两三秒,一篇“网感”十足的营销图文就自动生成了,“以前想破脑袋也写不好,嘿,现在咱也用上AI了!”

今年2月,像许许多多的科创公司一样,衔远科技迅速完成了自研模型与DeepSeek-R1的融合。李丰俭告诉记者:“多个场景应用证明,融合后,我们新的AI营销大脑‘MODI摹小仙’在创意写作上能力更强,同时还降低了复杂任务的处理成本。”

高文对此并不意外:“DeepSeek大模型能在全球爆火,除了其优化算法架构、大幅降低训练成本外,还在于它打破了人工智能大模型发展的传统范式,对模型进行开源,为开发者提供了广泛的二次开发可能性,推动了人工智能应用的大众化。”

何为开源?

即开放源代码,让任何人都可以查看、使用并改进这一新技术。这是一种开放包容的姿态——“DeepSeek-R1的面世,意味着开源模型正在超越闭源模型。”美国“元”公司首席人工智能科学家杨立昆给出这样的评价。而英国人

工智能云服务企业销售副总裁丹•  卡彭特则希望:“像这样的开源公司越多越好。”

这种开源的选择有迹可循。早在2017年我国发布的《新一代人工智能发展

规划》中,“开源开放”就已被确立为基本原则之一。

2月10日,我国外交部发言人郭嘉昆进一步阐述了这一理念:“中方积极推动人工智能普惠发展,帮助发展中国家加强能力建设,主张开源人工智能技术,促进人工智能服务的可及性,实现各国共享智能红利。”

四、审慎思考:“打破思维的藩篱”

DeepSeek的“破圈”令人鼓舞,但在调研中,“谨慎乐观”仍是众多受访专家的共同声音。华南理工大学公共政策研究院学术委员会主席郑永年提醒,我们要保持头脑清醒,尽管中国在迅速赶超,但从人工智能领域的基础研究,到硬件、软件、产业,再到规则制定,“美国还是占优势、占主导地位,这种情况并没有得到彻底改变”。

比如,我们需要解决芯片之忧。在硬件上,高性能AI芯片“一芯难求”,而国产芯片目前还无法实现完全替代。“芯片跟不上,中国就无法在人工智能领域实现真正的超越。”一位受访专家直言不讳。算力、数据质量、标准我们需要补上的短板还有很多。

比如,我们需要在下一代人工智能方法上取得更多原创性成果。不少业内人士认为,目前的人工智能还不是真正的“智能”,其消耗巨大能源资源的技术路径也必将难以为继。清华大学人工智能国际治理研究院战略与宏观项目主任刘典说:“未来人工智能产业的核心竞争力,依然在于能否在底层技术上不断取得突破。”

比如,我们需要更多顶级人才。美国一家智库发布的报告显示:最顶尖人

工智能研究人员工作的主要国家中,美国占57%,中国占12%。“相比欧美国家,跨学科复合型人才的匮乏将成为制约我国人工智能产业发展的重要瓶颈。”朱松纯担忧。

还有更多。“拓展开来,投融资的渠道是不是畅通?能不能率先找到盈利模式扩大市场份额这些问题能否解决,都对人工智能的发展起到至关重要的作用。”王磊说。

在专家们看来,这些问题都可以归结为——生态。

“不仅仅是芯片、模型和算力的对决,更是技术规则、市场份额和治理权力的竞争。”刘典指出,“人工智能产业已经摆脱了过去简单的‘技术竞赛’,转向更复杂的竞争模式。”

魏巍认为,应构建更完善的产业生态,加强上下游企业合作,解决硬件、

软件、数据、应用等环节的衔接问题,形成协同发展的合力。

中国科学院院士、南京大学党委书记谭铁牛多次提到,中国必须构建自主可控的人工智能创新生态。“我们要构建人工智能的‘新核高基’,即新型开放创新生态、核心关键技术与器件、高端综合应用系统与平台、具有重大原创意义的基础理论与方法。”

需要率先打破的,是思维的藩篱。北京大学智能学院研究员宋国杰坦言:“过去20年,我国科技工作者大多跟随西方科技前沿开展科技创新,这种习惯在当前绝大多数高等院校和科研院所依然存在。这种惯性思维如果不能打破,我们就很难有更多原始创新性的成果出现。”

2024年3月,国家自然科学基金委发布了《可解释、可通用的下一代人工智能方法重大研究计划》,围绕“深度学习的基本原理”“可解释、可通用的下一代人工智能方法”“面向科学领域的下一代人工智能方法的应用”3个核心科学问题,资助11类培育项目、8类重点支持项目。一位受访者说:“谁能率先取得突破,谁就能在未来的竞争中占据优势。”

“不能甘心追随国外的先进技术,要做创新技术的实践者,而不是先进技

术的应用变现者。”合肥工业大学软件学院副院长、教授薛峰的话一针见血。

全新的领域,更需要全新的“有组织科研”。朱松纯建议:“面向通用人工智能这样的原创性、颠覆性科学技术,要从基础前沿科学探索做起,形成‘学研产’的创新链条。传统的小团队科研组织模式难以胜任,‘大团队、大平台、大交叉’的科研组织范式才是我们迫切需要的。”

“破圈”仍在持续。

2月24日,DeepSeek宣布启动“开源周”,计划连续5天陆续开源5个代码库,将最新款人工智能工具分享开来。网友点赞:“‘源’神启动”“惊喜仍在上演”。

是啊,惊喜仍在上演!相信,在中国人工智能的创新之路上,带给我们惊喜的,绝不仅仅是DeepSeek!

从阿里巴巴到DeepSeek:政府有所不为,企业大有作为

第一财经日报记者钱童心

(2025年2月20日)

中国人工智能公司DeepSeek正在掀起AI行业的变革。

DeepSeek的崛起引发了人们对杭州这座城市的关注。近年来,杭州科技网红企业迭出,宇树机器人、《黑悟空》背后的游戏科学公司都屡屡成为“流量密码”。

DeepSeek为何没有诞生在中国的其他城市,杭州凭什么孕育出全球顶尖的人工智能企业?

一、有人才,才有一切

DeepSeek的创始人梁文锋并不是杭州人。

梁文锋1985年出生于广东湛江,高中毕业后考入浙江大学电子信息工程专

业,并在浙江大学拿下了信息与通信工程硕士学位。

浙江大学的就读经历,奠定了梁文锋的学术基础能力。浙江大学作为国家重要战略科技力量以及区域创新发展的核心引擎,为杭州的科技企业输送了不少人才。

企业界将DeepSeek、群核科技、宇树科技、游戏科学、强脑科技以及云深处科技,并称为杭州六小龙。它们的创始人中,除了梁文锋毕业于浙江大学,云深处科技的创始人朱秋国本科到博士阶段都是在浙江大学度过的,群核科技的创始人黄晓煌本科毕业于浙江大学竺可桢学院,后赴美国学习计算机。宇树科技的创始人王兴兴本科毕业于浙江理工大学,硕士就读于上海大学。

杭州六小龙的创始人,其中四位在浙江有就读经历。

业内人士告诉第一财经记者,王兴兴在毕业后一度没有找到工作,后来好不容易拿到了大疆的offer,一度去了深圳,但最终选择回杭州创业。一方面是因为他自己是浙江人,另一方面也是因为杭州创业的成本相比其他大城市要更低。“他选择杭州也是很自然的。”这位业内人士称,“杭州在吸引人才、培育创新企业方面具有独特的竞争力”。

一位曾在杭州工作过的科研人员对第一财经记者说道:“这几年杭州在抢人才方面还是肯下一番功夫的,DeepSeek的成功一方面受益于互联网时代的发展惯性,另一方面与浙大等顶尖高校的人才储备也密不可分。”

杭州的人工智能相关人才密度已经不弱于一线城市。

从人才资源来看,根据脉脉人才智库发布的《人工智能顶尖人才数据图鉴2022》,北京AI人才占全国的24%,排名第二的就是杭州,占16.53%,深圳仅占6.18%。

人才是一切技术型事业的开始。人才密度足够了,不管是开发硬件的宇树

科技,还是开发软件算法的DeepSeek才有突破的可能。

驻扎深圳十多年的人工智能医疗领域创业者林晓勇对此有深刻的了解。他的公司需要招聘激光领域的人才,在杭州,他能轻松招到当地浙大或者杭州电子科大的专业人才,而在深圳就招不到同等级别高校的人才。

“杭州过去前沿技术领域的企业并不多,但高校多,研究型人才的供给大于或者约等于需求, 所以人才资源是充沛的。 但深圳就是供给远小于人才需求。 ”林晓勇说道。深圳企业过去主要以商业地产或制造业起家为主,顶尖的高校也屈指可数。“前沿科技研发团队的搭建是一个长期的积累过程,不是说短短几年里花多少钱就能搭起来的。我们团队的研发人才都在其他城市,深圳几乎没有。”

二、“基本都是自己长出来的”

人尽其才的土壤,比顶级的人才更重要。

阿里巴巴是杭州另一家取得全球影响力的企业,而且比DeepSeek早了许多年。马云创办阿里巴巴的时候,其核心团队成员大部分不是来自于浙江最好的大学。

但这个立足于杭州的企业,吸引了毕业于耶鲁、当时是投资机构负责人的蔡崇信。现在蔡崇信是阿里巴巴的董事长。

2025年2月13日,蔡崇信在WorldGovernmentsSummit大会上回忆起加入阿里巴巴的原因。他二十余年前去马云公寓拜访的时候,看到门口有十几双鞋子,洗手间有12支牙刷。他意识到这个团队是全天候都在这里工作,这种类似“中国版车库”的创业氛围感染了他。

1999年之后的阿里巴巴,从国际市场融钱,拿到日本软银、美国雅虎等的投资;电商业务既面向中国消费者,也帮助中国企业货卖全球。立足杭州,而融资与市场面向全球,成就了一个全球化的企业。

阿里巴巴也在杭州培育了大量人才,激励了为数众多的创业者。但它成长期的资金,并不依赖地方政府,而是从国际市场融得。

DeepSeek的资金则是自筹,也并非来自政府基金。

DeepSeek的大模型开源,免费供全球开发者使用。美国的Meta、亚马逊以

及微软等都在其生态中接入了DeepSeek大模型。

浙大计算机系毕业、曾在湖畔大学学习过的杭州创业者乔伊对第一财经记者表示:“杭州过去是阿里巴巴一家独大,这次DeepSeek的成功,本质上体现了市场化的力量,这家公司通过自己赚钱,自己开发通用人工智能(AGI),市场化让底层创新的能力更好地得以发挥。”

一家杭州科技企业的CEO对第一财经表示,杭州本来就是市场化程度高的地

方,“杭州这些公司基本都是自己长出来的”。

2025年2月, 浙江省经济和信息化厅的 “浙江经信” 公众号披露, 确定了2024年浙江省人工智能应用场景50个、应用标杆企业25家、人工智能服务商34家、“数智优品”70项。

DeepSeek并不在这179家企业之列。

市场会实现资金和人才的自由组合,令市场中的企业出现意想不到的互动。

阿里巴巴和DeepSeek近期就出现了联动。

DeepSeek走红后,带动了以阿里巴巴、小米等为首的港股上市公司近期的一波大幅上涨。自今年1月以来,两家公司过去一个月的股价涨幅超过了30%,阿里巴巴目前股价已经涨至2022年7月以来新高。

三、培育自由生长的土壤

DeepSeek火遍全球之后,各地出现反思潮:它为什么出现在杭州,而没有诞生在自己的城市?乔伊对第一财经记者表示,上海、北京、深圳等城市作为中国的科技创新中心,也孕育了众多高科技企业,但杭州近年来在互联网和人工智能领域发展迅速,除了人才资源之外,与它拥有良好的创业环境和政策支持也密不可分。

在去年的杭州数贸会上,第一财经记者与当地的科创企业、政策制定部门相关负责人进行了深度的交流。他们给记者最大的感受就是“务实”,“将数据要素转化为生产力”在杭州并不是一句口号,而是落实到了具体的应用场景。

“DeepSeek这样的企业没有出现在深圳,我认为也是与城市的文化基因有关。深圳虽然创新企业很多,但是不具备‘进窄门走远路’的基因,深圳的氛围是‘搞快钱’。”林晓勇对第一财经记者说道。

“每个城市都有各自独特的产业优势和创新土壤,DeepSeek在杭州的崛起,

也正是这种多元创新环境的体现。”乔伊表示,“深圳也有深圳的优势,上海

也出了B站和小红书,杭州正好在这个阶段撞到了一个科技企业涌现的波峰。”

北京、上海、广州、深圳和杭州等城市,有不同的人口结构和产业基础,更有不同的土地约束条件,对外开放的力度也有所不同。

这使得各个城市呈现出不同的产业发展风貌,吸引和培育不同的公司。就如同美国只有一个硅谷,科技巨头如英伟达、谷歌和Meta的总部在加利福尼亚,不妨碍亚马逊扎根在西雅图,而微软总部则在华盛顿州。

在中国,杭州没有米哈游但有了DeepSeek,北京没有小红书但出现了小米,上海诞生不了阿里巴巴但有了拼多多,深圳没有吸引特斯拉落户但培育出了腾讯和华为。

这些企业都重视人才,各地方政府也同样如此。

2月14日,在2025年苏州市“人工智能+”创新发展推进大会上,《苏州市支持人工智能领域人才发展的若干措施》重磅发布,围绕人才引进、培养、评价、激励、服务等方面,集成推出9条针对性举措。深圳正在推动“20+8”产业集群从战略性新兴产业向未来产业升级。业内认为,这种转型比以往任何时候都更需要颠覆式创新的支撑,这不仅仅需要资金投入,关键是人才资源。

一家企业落地在上海,还是杭州,都不妨碍它吸聚天下人才。DeepSeek总部在杭州,但梁文锋也将清华、北大等中国顶尖高校的毕业生收入麾下,在北京也成立了办公室。腾讯总部在深圳,但它的电竞产业总部则在上海,因为上海致力于打造全球电竞之都。(文中乔伊、林晓勇为化名)

对话董煜:跑出DeepSeek,中国做对了什么

中国经济周刊记者侯隽

2025年龙年春节,全世界感受到中国经济的“暖流”。

春节消费市场再创新高,电影《哪吒2》刷新中国影史票房纪录,深度求索(DeepSeek)开源推理大模型R1成为人工智能发展史上的现象级产品……全世界不仅看到了中国经济态势发展良好,也震撼于中国科技创新的力量。

近期,本刊记者专访清华大学中国发展规划研究院常务副院长董煜,畅谈中国科技创新和经济发展的热点话题。

《中国经济周刊》:除了制定规划,我们发现各省份都把“科技创新”当作今年发展的关键词之一。尤其是春节期间,DeepSeek这家成立仅一年半的中国AI创业公司在全球范围内不断掀起关注热潮,占领各国头条新闻。惊喜、兴奋、激动之余,DeepSeek戳中大众的究竟是什么?

董煜:DeepSeek所引发的讨论及相关话题持续霸屏,不但成为AI发展史上的现象级事件之一,也让全世界对中国高度关注。对于中国广大处于成长期的小微企业和个人来说,DeepSeek通过降低人工智能的门槛,让他们看到人工智能究竟可以产出怎样的魔幻成果,为他们提供了一个能够实现梦想的工具。同时DeepSeek的影响力远远超越了中国的范畴,对全球科技来说也具有非常重要的意义。它为全球创业者、投资者提供了实现梦想的机会,因为它是一个开源的工具,更重要的是它展现了中国方案的开放性。对我们中国人来说,这无疑是一件值得自豪的事情。

《中国经济周刊》:很多外国媒体都惊异于DeepSeek完全是由中国本土团队研发。同时,春节晚会上杭州宇树科技机器人扭秧歌、转手绢,惊艳舞台,也让外界对中国科技创新刮目相看。这一系列成就引发外界对“中国式逆袭”的广泛讨论与思考。您怎么看?

董煜:所有偶然背后都是必然。此前,TikTok“难民”涌入小红书,让民间开启对账单模式,外界对中国的认识不断刷新。现在大家都在热议以深度求索为代表的杭州“六小龙”科技企业,这其实是我国多年以来持之以恒投入科技创新、培养科技人才的结果,也是坚持长期主义、紧跟时代脉搏的必然结果。

面对外部环境不确定性的挑战,中国产业结构的调整和新旧动能的转换会更依赖硬核科技创新,需要更多人不计回报地探索未至之境。近年来,随着人工智能的发展,科技已成为主导未来的革命性力量。中国科技行业年轻工作者

们正不断涌现,而以DeepSeek为代表的优秀企业,将成为全球科技发展的“中国力量”。我们也希望这样的创新成果,在今年、在未来,还会不断涌现,给中国和世界带来更多惊喜。

《中国经济周刊》:目前,游戏科学、深度求索、宇树科技、云深处科技、强脑科技和群核科技等科技新锐频频刷屏,杭州“六小龙”声名鹊起。很多省份也在打造营商环境,期待有更多的独角兽公司涌现,您认为各省份比拼的关键是什么?

董煜:在2025年的地方两会上,许多省份的关键词之一就是“环境”。很

多省份都把打造“良好营商环境”写进地方政府工作报告中。

杭州的经验和做法,并不在于产业谋划上面具体做了多少,而在于政府在营造创新与产业发展环境方面所发挥的良好示范引领作用。当前,新一轮创新创业热情正在人工智能、生物科技、商业航天、文化创意等前沿领域奔涌释放。站在新起点上,我们不妨重新认知“中国创业者”和他们正在塑造的未来中国。

政府部门在政策上要给予一种宽松的环境。例如,对于人工智能等新技术在传统产业中的应用,要予以鼓励和支持,机制要设计好,既要确保新技术的顺利引入,也要有相应的退出机制,甚至连政府部门也可以加入到创业者的队伍中来,通过政策支持、资源整合和创新服务,形成许许多多的地方政府躬身入局与创业者相向发力的态势。

目前,这种创新创业的浪潮已经涌现,我们一定要珍惜这种氛围,一定要以鼓励为主,看到好的样板就要把它“抬”起来,让各方面能够看到示范性效应。我也期待今年有更多的“杭州”出现。

《中国经济周刊》:今年春节期间还有一个“3岁”百亿影帝《哪吒2》诞

生了。作为经济学家,您怎么看待一部动画片创造中国电影史上票房新纪录?

董煜:《哪吒2》的成功,不仅在票房上取得了骄人成绩,更在文化创新方面作出了巨大贡献。在这部电影中,哪吒不仅是一个卡通角色,更成为中国新的文化象征。哪吒不仅受到了年轻观众的热爱和认可,成为他们心目中的英雄,也获得全年龄段观众的喜爱。这种跨越年龄和文化的广泛共鸣,让《哪吒》成为中国影史上的里程碑。

《哪吒2》打破了人们对中国电影的传统印象,让全球观众看到一个不一样的中国。哪吒所传递的价值观让人耳目一新,清晰地展示了中国人具有的创新精神和时尚感。谁说中国的文化一定要循规蹈矩?通过《哪吒2》,我们不仅展

示了成熟的电影工业,更向世界传达了一种新的理念:我们可以引领潮流,创

造新的文化符号。

值得一提的是,《哪吒2》背后的制作团队也非常年轻,他们不拘一格,具有灵活应变的创作思维。正是这些因素让《哪吒2》能在短短的时间内打破多个票房纪录,成为毫无争议的“影帝”。这是中国电影行业的一次共同胜利,也为未来的创新指明了方向。

我们期待有更多的故事能够像《哪吒》一样,不仅仅是娱乐,更是文化的传播。让我们一起见证中国文化的新生力量,期待更多打破刻板印象的作品问世!

《中国经济周刊》:2月5日是春节后的首个工作日,全国各地多省份都召开了2025年“新春第一会”。很多省份都明确提出要做好“十四五”规划收官和“十五五”规划编制工作,为什么各省份都把“五年规划”放在如此重要的地位?

董煜:五年规划非中国首创,也非中国独有。印度、法国、韩国、日本等

国家都在发展规划上进行过探索与实践。

新中国成立以来,我国共编制实施了14个五年规划。这14个五年规划,展示了新中国70多年发展道路上的重要成就,尤其是中长期发展的一些重大任务、重大工程都是通过五年规划的方式把控执行。

中国经济之所以能够保持持续稳定的增长,一个重要秘诀就是在于国家层面向来都不是只考虑短期的经济增长,而是将中长期规划与短期发展紧密结合,致力于推动高质量发展。保持清晰的思路,既要把短期的问题解决好,又要在这个过程中不耽误谋划中长期的发展。为此,我国将一系列中长期的解决方案纳入五年规划当中,通过规划重要目标、制定关键政策、实施重大工程,从而确保国家经济持续稳步前进。可以说,五年规划和体制改革之间的深度互动,也是中国发展奇迹的“源头活水”。

对接DeepSeek,主流媒体破浪前行

中国新闻出版广电报记者朱子钰

(2025年2月18日)

短短两年时间,AI(人工智能)圈又出“王炸”!

自1月20日发布以来,DeepSeek(深度求索,简称DS)引发全球关注,成为史上用户数增长最快的互联网产品。率先感知到新趋势的媒体纷纷宣布接入大模型DeepSeek-R1,“DeepSeek传媒行业应用创新联盟”宣布成立一场深刻的行业变革正在悄然进行。

当下,AI赋能新闻生产已经成为不可逆转的潮流。新的技术频繁问世,AI还会不断给新闻带来冲击。DS会怎样重塑新闻业?新闻从业者又该如何化焦虑为动力?近日,《中国新闻出版广电报》记者采访了多家主流媒体及权威学者,深度触摸媒体+DeepSeek的未来路径。

一、重要拐点出现,利用不好将会被淘汰

DS正以惊人的速度渗透到新闻行业中,主要应用于报业集团和广电集团等主流媒体旗下的新媒体。据不完全统计,已有20余家媒体宣布接入,包括大众报业集团大众新闻客户端、河北日报报业集团纵览新闻客户端、四川日报报业集团川观新闻客户端、成都传媒集团每日经济新闻客户端、江西日报社江西新闻客户端、河南广播电视台大象新闻客户端、浙江广播电视集团智媒果平台、重庆广播电视集团第1眼TV-华龙网、山东广播电视台闪电云平台、福建省广播影视集团海博TV、天津津云新媒体集团等。市县级媒体也并未置身事外,比如河南省地市级媒体驻马店融媒、四川双流区云上双流客户端、江西瑞安融媒等也宣布接入,并且,接入的媒体数字还在增长中。

从ChatGPT、Sora再到DeepSeek,技术的发展,让新闻业在挑战与机遇的风云变幻间破浪前行。那么,此轮变革又有何不同?

“DS将推动媒体行业在内容生产、 分发、 营销和管理等方面的颠覆性变革。 ”中央民族大学新闻与传播学院教授郭全中接受记者采访时表示,DeepSeek-R1是开源推理模型,今后的迭代与更新会更快。其次是极致的性价比,有人称之为AI界的“拼多多”。

生产成本的降低与生产力的提升,打开了DS接入媒体的新景观,

DeepSeek-R1擅长复杂任务, 且免费商用。 “与OpenAI的闭源策略形成鲜明对比,

DS开源生态与社区支持优势显著,开发门槛极大降低。同时,开源模式吸引了大量全球的开发者参与技术优化和二次开发,加速了模型部署优化和模型在细分场景的适配。”四川日报全媒技术中心首席产品官董晓尚告诉记者。

河北新闻网副主任、河北日报数智科技有限公司总经理李琳负责纵览新闻相关技术运营。他认为,低成本使得他们在应用过程中,能用较少的投入获得高效服务,将会有更多资源用于内容创新和用户服务优化。

可以看到,DS通过较低的成本带来了大规模的普及使用。“所以,这将会是一个重要拐点,如果媒体利用好DS,将会完成自身的涅槃转型。如果利用不好,那可能会在未来被彻底淘汰。”郭全中预测。

二、接入只是开始,必须产生化学反应

第一批接入DS的媒体,获取了先发优势,为用户率先提供了更智慧、更丰富、更高效的全场景服务。记者了解到,春节假期,大众报业集团组织使用DS尝试辅助评论内容创作,技术研发团队研究部署并接入大众新闻客户端。春节假期后第一天,即在全国媒体中率先发布“DS接入大众新闻”。

“借助DS,通过设定好稿件布局、字数要求,补充进基本信息,几秒钟就生成了‘大众新闻接入DS’的新闻初稿。从构思稿件结构到稿件调整修改,前后2个多小时便完成了稿件创作,创作效率大幅提升。”大众报业集团信息技术部主任、“大众”新媒体大平台经管委委员汤代禄向记者分享“尝鲜”体验。

当然,先发优势并非高枕无忧。“接入只是开始,媒体还要思考怎样在DS基础上做好传播产品、开展传播创新。”北京师范大学新闻传播学院院长张洪忠在接受记者采访时表示。

简单的物理接入解决不了根本问题,形成化学反应或许是制胜关键。从现实经验看,接入DS后,AI将深度融入新闻生产全流程,包括内容生产效能的革命性提升、客户端服务的全场景智能化升级、数据驱动的精准传播与舆情管理、技术架构的集约化转型等。

汤代禄告诉记者,目前大众报业集团大众新闻、海报新闻、半岛新闻、风口财经等新媒体平台以及各类业务平台纷纷接入DS,在产品端为用户提供智能服务。

川观新闻依托千亿级参数大模型的精准意图识别能力,智能助手“小观”实现智能语义理解、多轮对话交互等核心技术突破,升级成为更加聪明的“智能体”,大大提升信息获取效率。“针对川观新闻原创报道,‘小观’能够智

能标注文章核心观点,生成结构化摘要,帮助用户快速抓取关键信息。”董晓

尚介绍。

“DS已应用于纵览新闻客户端的多个关键新闻生产环节,例如,选题策划、智能审校、舆情服务、阳光理政、热点监控、事实核查、跨界融合报道等。”李琳特别提到,技术落地需结合媒体自身特点。河北日报报业集团将建立“技术—内容—用户”闭环反馈机制,确保AI工具服务于“内容为王”的核心战略,而非止步于概念炒作。

重庆广电第1眼TV-华龙网推出的垂直新闻大模型“芯问”与DS深度融合。“这将构建起覆盖新闻生产全链路的智能中台,进一步提升在内容智能创作上的能力。”第1眼TV编委、华龙网内容负责人刘颜告诉记者。

“到目前为止,主流媒体还在积极地探索,唯有把DS从辅助工具升级到‘智

能体’等的应用,才是真正用到实处的举措。”张洪忠认为。

三、依靠强制内嵌,变成最有力的武器

积极主动与新技术共生共成长,将它变为手中最有力的工具和武器,才是

AI赋能新闻的美好愿景。

有一个显著的例子可以感受AI的魅力:打开每日经济新闻客户端的大模型平台,DeepSeek-R1、Kimi和豆包等6款国内主流大模型赫然在列。记者在“问公司”输入“光线传媒”,即可出现大股东揭秘、高管变动指数、赚钱能力等十大问题方向。《每日经济新闻》编委肖勇表示,2月12日发布以来,每经大模型平台已累计获得8万多次访问。

“所有的新技术在传媒业的应用中,都需要一个强制内嵌。”在郭全中看来,强制内嵌有两个方面的含义,第一是把新技术内嵌到行业的整个流程中去,第二个是确保行业人要真正用起来,熟练掌握它。

“强化智能助手问答的实用性,打造好用的垂类智能体。‘小观’智能助手将基于DS上线更多对话式的资讯助手功能,大幅缩短用户使用客户端核心功能的路径,为用户提供更多便捷、有用和有趣的知识问答功能。”董晓尚表示,川观新闻客户端还将打造“智识”产品,赋能川观智库建设,构建覆盖各级政府的产品体系,建设技术引领的新型媒体智库。

深耕本土垂类内容,也将是媒体+DS的未来赛道。“基于DS,我们将为用户提供具有河北日报报业集团特色的服务。比如,针对河北地区的农业发展,利用DS的知识储备和数据分析能力,为农户提供农业生产指导、农产品市场行情

分析等服务。”李琳表示。

在刘颜的观察中,“芯问”大模型融合了重庆本地主流媒体与资深撰稿人数字资源,紧密结合重庆本地的地域特色和文化内涵,这一点是其自身的优势与特色。

汤代禄透露,大众报业集团将深入研究DS各项功能和API接口,紧紧围绕集团“大众”新媒体大平台、山东省数字文化集团、大众国际传播中心、垂类行业平台等核心业务,以产品化思维打造“大海蓝天”系列技术产品、技术服务,做强齐鲁文化数据库、齐鲁文化大模型,研发系列齐鲁文化名人智能体、数字乡村史志智能体等。

DeepSeek首秀媒体圈:首批尝鲜者讲“拥抱”感受

中国新闻出版广电报记者朱子钰

(2025年2月25日)

一石激起千层浪!1月20日,杭州深度求索人工智能基础技术研究有限公司自主研发的最新开源模型DeepSeek—R1发布后,引发全球关注。短短一个月的时间,DeepSeek的“冲击波”快速渗入各行各业。比如,已有多地提出引入DeepSeek辅助领导干部决策。

在这场“震撼硅谷”的剧烈变革中,主流媒体更是率先入局,全面拥抱,成为大模型落地场景的首选。在与DeepSeek接入之后,怎样塑造“人无我有”的独家优势呢?近日,首批接入DeepSeek的5家主流媒体的技术相关负责人接受《中国新闻出版广电报》记者独家专访,第一视角解析“DeepSeek+媒体”的硬仗如何打。

一、AI狂奔DeepSeek到底妙在何处

在不少人还在为DeepSeek感到震惊之时, 务实而又前瞻的媒体已尝到了 “第一口螃蟹”。大众报业集团大众新闻客户端、河北日报报业集团纵览新闻客户端、四川日报报业集团川观新闻客户端、成都传媒集团每日经济新闻客户端、重庆广播电视集团第1眼TV—华龙网作为首批宣布接入DeepSeek的主流媒体,开启了全新的应用形式。

在此之前,有些媒体已与文心一言、豆包、通义千问、智谱清言等接入,但从最终结果来看, 人工智能 (AI) 还不足以有完全替代的能力。 此番, DeepSeek横空出世,又将如何搅动江湖?

“DeepSeek最大的特点是推理,让国内用户第一次看到了AI回答问题的思考过程,而不只是一个结果。”《每日经济新闻》编委肖勇观察到,AI的推理思考过程让不少用户觉得给自己的工作带来了启发。“价格低也是DeepSeek的一大优势,让普通人和小企业也都能用得起,这也符合科技平民化的目标。不过,国内大模型厂商竞争比较激烈,而且训练成本也在下降,未来AI的价格普遍会走低。”肖勇说。

四川日报全媒技术中心首席产品官董晓尚总结为算法优化创新、硬件适配、开源生态3个方面。“国际主流AI模型多基于英伟达CUDA框架构建。DeepSeek则采用PTX语言进行开发,这种架构既规避了CUDA生态的兼容性束缚,又为国产芯

片的深度适配开辟技术通道。”董晓尚对记者表示,目前DeepSeek的开源生态

已经吸引了大量全球开发者参与优化,形成技术迭代的“飞轮效应”。

与其他AI工具相比,DeepSeek在应用成本上形成显著优势,比如,和国内一些AI工具相比,其综合能力和开放性独具特色。语言处理上,它贴合国内用户习惯,对含文化内涵的中文理解准确,输出文案无需大幅修改。

“DeepSeek—R1的API服务定价与同性能的海外主流模型相比,价格大幅降低。低成本使得我们在应用过程中,能用较少的投入获得高效服务。”河北新闻网副主任、河北日报数智科技有限公司总经理李琳表示。

DeepSeek在应用侧的惊喜,令大众报业集团信息技术部主任、“大众”新媒体大平台经管委委员汤代禄印象深刻。“自1月底以来的3周内,大众报业集团就推出百余篇相关报道或辅助创作内容产品,大家普遍惊喜于生成内容质量的提升。”汤代禄说。

二、为我所用创新落地场景与服务

新技术来势汹汹,但其实并不可怕。对于媒体而言,与新技术的融合共生,延伸触角,打开了下探空间。主动拥抱人工智能,积极探求新路径,为应有之义。在与众多大模型的合作中,主流媒体借力为我所用。

内容生产、内容分发和内容消费是新闻业价值链的主要环节。AI正深度参与重塑它们。在DeepSeek爆火后的短短一个月内,主流媒体能够积极把握先机,来源于他们对AI发展的前瞻性思考。

据记者了解,2019年,《每日经济新闻》就提出了AI战略,并把2020年确

定为技术转型元年。

新闻客户端和网站的建设素来是新闻媒体平台建设的难点。“以往,各个媒体的客户端和网站比拼主要在内容层面,依靠独家、深度、快速和高质量的新闻报道来吸引读者。然而,今日头条这类算法平台以及微信公众号已经给用户提供了更快更全面的信息获取渠道。因此,新闻媒体自身的客户端和网站建设往往成效有限。”肖勇表示。

接入《每日经济新闻》,意味着每日经济新闻客户端和网站已不仅仅是新闻资讯平台,而是转型成为智能互动平台。他们把这次升级称作“136计划”。最显著的变化是,用户可以直接在每日经济新闻客户端和网站使用六款大模型进行自由对话。

特色服务的打造颇有看点。比如,在财经新闻领域有优势的《每日经济新

闻》将公司、投资和财经与大模型能力结合,重点推出3个专业化的核心栏目— —《问公司》《问投资》《问基金》,为用户提供更加精准、高效、便捷的投资决策支持。

对于用户来说,在DeepSeek端直接使用与在新闻端使用DeepSeek,两者有何不同?这拷问着接入的实质效益。率先物理接入后,媒体如何能够创新落地场景,真正产生化学反应才能塑造竞争力。否则只会是蹭热度的噱头。

汤代禄表示,“DeepSeek的出现,并不是从无到有的开创,而是从1到10的量级跃升。所以当前应用场景和新闻服务更多的是优化提升,有了更擅长逻辑思维的大脑。”

“未来,我们将继续加强学习研究,一是在更多应用场景上发力,创新内容风控、数字员工、智能体等应用新场景;二是在开辟更多新赛道上发力,创新数字乡村、健康服务、法律咨询、交通服务等更多服务新赛道。”汤代禄说。

同样,川观新闻不断丰富“智能+智慧+智库”的智媒体内涵,借助DeepSeek加大在内容创作、智能推荐、用户互动等领域的应用力度,持续提升主流内容的传播效能,积极扩展新闻传播以外的智能服务。

“基于对话系统、大语言模型、问答系统等核心NLP系统,我们开发上线了小观智能助手,助力‘若水’四川省情语料库加速整合各级政府机构权威发布数据,形成省情高质量数据集及数据应用标准化服务体系。”董晓尚表示,四川日报报业集团还推出“领导去哪了”“四川百事通”“跑会达人”智能体,全力打造川观智库,构建覆盖各级政府的产品体系,建设技术引领的新型媒体智库。

深耕本土内容,也是主流媒体与DeepSeek融合赛道上的发力点之一。

“作为河北省级党媒,我们将充分发挥对本地新闻资源的深度挖掘能力。利用DeepSeek分析本地用户的阅读偏好和关注点,围绕河北的时政、经济、文化、民生等领域,生产更贴合本地用户需求的新闻内容。”李琳举例,在报道河北本地的政策实施时,通过DeepSeek快速梳理政策要点对本地居民的影响,为用户提供更具针对性的解读,这是其他媒体难以复制的本地化优势。虽然在接入初期,大多数媒体对用户采取了免费模式,但也有媒体向记者透露,随着技术的不断成熟和应用场景的拓展,未来或许会引入付费模式。融合之后人机协同来了可以预见,AI的影响下,新闻行业的底层运行逻辑将会发生改变,重塑业态正在加速进行。在这场变革中,机遇与挑战并行,行业内没有人能置身

事外。不少专家预测,AI赋能新闻将会朝着人机协同的路径演进。

从用户角度看,借助DeepSeek的技术支持,华龙网的“芯问”大模型将具备更高效处理海量数据的能力,能够更快速地抓取全网热点事件,同步解析主流媒体报道趋势与传播路径,同时快速生成高质量、结构清晰的新闻稿件,并结合用户需求提供个性化内容推荐。“这将为采编团队的动态化选题高效决策提供支持,助力重大新闻‘零时差’响应与差异化策划。”第1眼TV编委、华龙网内容负责人刘颜告诉记者。

人与机器、媒介与技术将在形态、机制和内在逻辑层面实现深度融合。

DeepSeek已经应用到大众报业集团工作的各环节,如各媒体记者主要用于分析类、评论类作品的创作,提出问题,请DeepSeek分析。在智库研究、舆情分析等业务中,数据分析人员借助DeepSeek进行数据梳理、信息分析和长文本提炼。在技术研发团队,程序员们尝试代码片段的编写,已有代码的检查。技术运维人员用于技术参数、系统参数分析。

2024年,大众报业集团持续举办生成式人工智能应用训练营,500多人次参与,引入国内外文、图、音、视等类型的AI工具二三十种,常态化设计制作推出AI创作作品千余件,作品类型涵盖短视频、微短剧、长图、H5、MV、智能体等形态,设计制作越来越精良。

短视频新闻、虚拟主播、一键生成视频AI的接入正在重新分配新闻生产中的角色。“首先是效率大幅提升。AI能在海量信息源中快速筛选出有价值的新闻线索。”李琳提到,

像简单的体育赛事结果报道、财经数据新闻等,AI能根据既定模板和数据快速生成初稿,记者只需在此基础上进行完善和深度加工,大大缩短了新闻生产周期。

“AI可以承担重复性工作,如数据整理和初稿生成,而记者则可以转向深度调查、故事挖掘和内容审核。”董晓尚表示。

肖勇介绍,《每日经济新闻》的记者很早就在用AI拟定采访提纲,尤其在突发采访的时候,AI可以几秒生成一系列问题。AI的融入可以让新闻工作者以很低的成本从“一专一能”转型成“一专多能”。

准确性、客观性是新闻报道的基本要求。“但目前AI依然有严重的‘幻觉’问题,而且互联网上会出现大量AI假消息,这样就要求记者编辑的基本素质更加过硬。其次,AI大规模使用后,资讯同质化现象可能更加严重,这也要求记

者编辑要发挥采访能力、调查能力、策划能力,才能生产出超越AI的高质量报道。”肖勇说。

数字出版人热议DeepSeek

中国出版传媒商报记者张馨宇

(2025年2月14日)

一、宋吉述(江苏凤凰出版传媒股份有限公司总经理):人工智能最重要

的作用是业态升级与创新

凤凰传媒在AI技术应用于出版流程方面进行了多方面的投入和尝试。探索开发了“凤凰智灵”人工智能应用综合服务平台,集成10多种AI能力,提供了30多个与出版相关的智能应用,如智能问答、办公、出版及营销等服务,一定程度上提升了工作效率。相对于出版社,凤凰旗下的学科网对人工智能应用更加广泛深入。学科网目前为全国4万所学校、超6000万会员提供教育资源服务,日均更新内容资源2万套左右。在其运营中,AI降本增效的应用场景包括替代搜索引擎的AI工作助手、提升销售系统智能属性、版权服务及客服应用、辅助设计师创作、知识库问答、代码编写和SQL编写、文本处理和数据整理等多个方面。此外,公司还探索开发了教育领域的专业模型建设,如“AI小博士”。从凤凰传媒来看,AI实现了对出版社部分生产的改进提升,但总体上应用尚未普及深入,流程变化不大,专业化数字公司使用人工智能技术较多,更倾向于生产经营流程的变革。

【怎么看】我近期关注并使用DeepSeek(以下简称“DS”),还安排相关员工对其进行了研究,特别是与凤凰传媒教育出版相关的中小学教育试题解答、试卷等教育资料生成等方面。总体测评来看,DS在小、初、高各学科的解题能力比较高,正确率90%以上。2月11日,我们打造的凤凰智灵平台正式部署了DS系统,员工可以方便地利用其生成内容,并计划开发针对中小学教育的专业模型服务。

我认为DS对于出版业的影响是非常复杂的。首先是挑战。随着其内容生产能力的提升,部分传统出版内容会被取代,出版的知识传播作用也会被削弱,出版的形式也可能发生很大变化。在未来愈加碎片化、精准化的内容知识服务中,很难想象现有图书形式的存在。其次是机遇。一方面,可以提高生产效率,另一方面,也是更重要的,是其作为一种新的技术革命,带来了新的文化服务形式和新的文化消费需求,也就是为出版业的产品创新、服务创新、市场拓展提供了可能,也就是“破圈”的机遇。所以,如同近些年发展起来的大数据、

VRAR、区块链等数字技术一样,人工智能最重要的作用不是提高出书效率,甚

至不是卖好书,而是业态升级与创新。

【怎么用】与DS公司合作,单体出版社是很难形成优势的。就出版社引以为傲的内容来说,DS已具备丰富海量的知识,而大部分出版社规模不大,出版门类多而杂,内容积累不多,很难形成内容优势。要发挥好出版社的优势,至少要从两个方面强化:一是专注于细分门类,加强专业化、体系化内容建设。做数字化产品与出书不同,图书讲究单品质量,即使比较零散、门类杂一点问题不大,但数字化产品高度依赖持续性积累与运营,需要海量内容支撑。二是垂直领域的运营能力。大模型虽然功能强,但对于每个细分领域来说都会有缺陷和不足,垂直化市场也需要专业化服务,这方面也不是互联网企业和通用产品的擅长。所以,出版社应该发挥自身在某些领域、区域的影响力,注重持续服务,深耕专业化市场。

此外,在人工智能产品建设运营中,还要注意两个内容相关难题:一是版权管理。当前人工智能训练中所使用的内容已经突破了原创性内容,不少模型都在使用二度加工、三度加工后的内容,版权溯源非常困难。但出版业数字化发展迟缓的主要原因不是盗版问题,而是数字内容不足不精,缺少市场吸引力,以及运营能力不足等。所以,总体不能因噎废食,应该积极拥抱新技术。二是内容合规。出版社做专业模型,服务于专业市场的前提是内容合规,应发挥好出版社的内容辨别与审核作用。当然,还要注重技术手段的应用与创新。

若与DS团队合作,期待DS技术在数字出版领域重点优化三方面:一是专业化内容的生成能力。DS与其他模型一样,通用性的内容生成较好,细分领域则缺乏专业性。二是内容合规性的审核。内容服务的基础是合规,不仅要尽量降低幻觉问题,更要杜绝非法内容。这固然可以通过加强审核来实现,但更重要的是技术手段,是模型本身对幻觉内容、非法内容的审核与过滤。三是行业性特色服务。例如针对教育,根据其特殊需求,提供评测等相应服务。这些专业能力建设可以基于和专业公司例如出版社等的合作而形成,期望通过合作形成专业化、精准化产品与服务。

二、赵海涛(中国音像与数字出版协会出版融合工作委员会副主任、中新

金桥集团公司总裁):带来技术平权与公共技术能力提升

【怎么看】与其他大模型技术一样,DeepSeek(以下简称“DS”)对出版业的思维模式、产业定位、作业流程和方法、服务形态到商业模式等方面都会

带来极大冲击和改变,目前看,DS超越其他大模型技术的方面在于其算法优势、

技术开源、低成本应用、中文处理能力强等。

出版业大模型技术的发展和应用,将会由通用大模型转向专业大模型(或称为垂域大模型),满足出版业在内容生产、版权保护、精细化、专业化、个性化服务等方面的实际需求。随着技术的持续发展,大模型技术在智能编辑与创作、沉浸式阅读体验、知识发现和知识管理、教育出版与个性化学习、文化输出与国际传播、智能营销与用户互动等方面会出现更多细分的应用场景。

DS已经成为全民关注的现象级技术体系,我们更多关注和评判的角度的是其技术特性、使用门槛、可持续应用能力以及与业务的契合性等。我们的技术跟 踪 从 2024 年 12 月 DeepSeek-V3 的 发 布 开 始 , 其 性 能 与 GPT-4o 和ClaudeSonnet3.5等顶尖模型相近,完全开源而且训练成本很低。?之前我们在公司所主导的“融合出版和数字教材”“融合采选”“知识图谱和知识发现” “数字内容发行”等相关数字出版应用技术平台中已经陆续接入了其他开源大模型技术能力,目前也已经完成了DS的部署和对接,并正在进行各种功能的效果评估和优化。未来我们也希望能够与这些DS大模型企业有更直接更深度的合作。

DS在数字出版内容创作、校对、营销等环节会带来很多改变,这种改变首先体现在大幅提高传统工作的效率、质量和效果,其次我们还要观察是否会进一步带来颠覆性的变化,这种变化可能会彻底改变行业原有的经营管理思维、业务流程、人员能力要求和交付模式等。

【怎么用】与DS公司合作,是大模型底层算法技术基础、预训练数据与应用场景、用户服务方面的协作及优势互补。这一轮DS带来的技术平权和公共技术能力提升,让业务端可以更专注在优质内容创作和场景服务方面发力,而不用过多考虑技术支撑能力。因此合作各方可以充分发挥自己的优势,共同推进产业变革。

应用DS这样的大模型技术,可以有效地提升生产创作、内容合规、质量管理的工作效率,也可以高效率跟踪和监测版权运用状态,在具体操作方面,有着很大的想象和提升空间。但是在生产创作方面,过度依赖AI能力,可能会存在较为严重的内容同质化问题,影响出版业核心竞争力。另外,出版业要能够应用大模型技术实现高质量高效能的生产创作和知识服务,就必须聚集更多的优质内容作为统一的数据基座,这很可能涉及版权权利合法运用等问题。

甚至在拓展国际市场方面,通过应用DS相关技术,可低成本快速实现中文作品自动翻译,显著降低海外用户对优质内容的发现和使用门槛,从而降低本地化成本并加速内容输出效率。同时,基于深度学习的智能分析能力,可精准匹配海外用户偏好,提升内容触达率和用户黏性。我们从2023年起开展了海外业务,今年也希望通过DS的技术加持,扩大中文电子书在海外的销售市场规模。

目前来看,AI技术变革必定会加速出版业的数字化和智能化转型,传统的数字出版也会从原有的数字化转型阶段全面快速向智能化方向发展。随着AI技术的应用,我们的生产工具和生产方式都在发生着本质的变化,数字出版也会更加关注用户的个性化服务需求,这将极大影响原有的业务形态和流程,这个变化是全面的。随着这个变化,首先要解决新的世界观和思维方式的形成,要能习惯大模型驱动的新质生产力所带来的工作流程、作业方式、多模态内容输出、内容交互、数据分析、个性化服务、消费方式等各方面会产生的深刻变化。其次,是重点关注并把握数据确权和数据资产管理、数据赋能和版权运营、场景设计和产品服务、用户交互和隐私保护等方面带来的大量发展机遇。

三、汤杨(龙源数字传媒集团执行总裁、文可AI首席执行官):让更多人可以参与到AI发展进程

【怎么看】我从春节才开始关注DeepSeek(以下简称“DS”),先是国外媒体的评价,然后作为用户体验,也看了发布的论文了解其基本逻辑。这的确是中国创新的里程碑事件,很自豪也很受启发。

有人提出,DS是目前对于汉字理解最深刻的模型,在我看来,不如说是对人性理解最深的模型。之所以这次DS能破圈,可以从两个层面来说:站在用户层面,它能让表达非常差的人也能获得一个超过85分的结果。用户几乎不是很需要提示词学习、思维层级、表达能力、批判能力等,也能够获得一个好的答案。有技术突破,但是我认为也有很多产品逻辑层面的突破。比如DS会帮你做很多决定,风格、写作目的、细节程度,在没有要求的情况下,会尽可能完整,尽可能包括更多知识点。

我认为DS对出版业影响最大的是降低了各出版社的私有部署成本。出版社之前最担忧的是,在做AI应用的同时把内容喂给各个大模型,现在私有部署了就可以不用担心这一点。因此,在我来看,DS可以让更多出版商参与到数字出版的AI化进程。以前由于对数据外流的担忧,很多人想下场但又不敢下场,现在这个担忧获得了结构性解决,让更多中小型出版单位和传媒单位可以参与进

来。

【怎么用】实际上,在关注到DS后,龙源数字传媒第一时间做了接入,并且部署了私有版本。接入后,最大的好处是我们作为3000家刊社和出版社的合作伙伴,可以更好地保护合作方的知识产权。另外DS在创作型文字方面比目前市面上的大模型都更有优势,所以在文学方面会有AIGC内容出来。去年年底,我们推出的“一书一AI”出版社图书伴生智能体业务,也是今年集团的重点业务,借助DS,可以实现的功能多了一些。

值得关注的是,DS能够在模型层面就有了控制意识形态的能力,这非常重要,意味着大模型是有价值观的,就有能力向善。但其中也存在一些风险,比如如果开启DeepSeek-R1和互联网关联,会幻觉出非常多的细节和数据,这方面希望使用它生成内容,特别是知识内容的人需要注意进行事实依据的核实。

现在很多人都在谈与DS团队的合作,我认为应该让他们去做真正的尖端科学,商业化的部分充分利用最新的科学边界来实现,交给那些理解AI技术及其发展原则的企业去完成,和各产业理解AI、尊重AI发展原则的企业携手共同助力产业发展。出版、传媒、金融、医疗等领域都希望深度探索时有一个主要合作伙伴负责商业化,如此一来,也能够解决DS创始人梁文峰和团队构建的生态关系。这是一种后资本时代之后的新生态。

四、付鹏(中信出版集团信息数据中心总经理):让出版社以最少资源获得较好AI能力

本单位近两年开始全面做AI布局,对于AI在出版过程中的应用作了深入探索,在AI技术应用上,我们针对选题、翻译、审校、营销等各个业务环节,进行了多项AI赋能的探索,从结果来看,AI确实可以为出版大幅度地提质增效。基于探索结果,我们自主投入研发了夸父AI平台,目前已经在社内铺开使用。另外,在数字内容制作上,从图文内容、音频内容、视频内容、数字人等方面,中信出版也作了全面探索,从结果来看,AI可以很好地辅助数字内容创作,在某些领域,可以使创作效率提升1倍以上。可以说,AI技术变革已经使AI能够部分替代数字出版物的创作过程,并且可替代的比例也在快速提升。

【怎么看】我是在春节前关注到DeepSeek(以下简称“DS”)的,从使用情况来看,DS的表现不输于其他任何大模型,更惊艳的是它的深度思考功能,可以直观地看到DS的思考过程非常有逻辑性、非常智能。另外,DS的模型是开源的,目前中信出版已经在万象亿新智慧出版体系-夸父AI平台中部署了70B的

DS模型,并且部署的算力需要非常小,这使我们可以用最少的资源获得比较好

的AI能力,对出版社来讲非常友好。

从过去2年来看,AI大模型技术已经被广泛应用在内容创作领域,但是对于优质内容的输出来讲,质量是不够的,而DS通过更优秀的推理能力,结合思考能力,不仅可以写出通顺的文稿,更能够较好地梳理文稿结构,提出较为全面的策划角度。从内容创意的角度看,人机结合或将成为未来的趋势。在审核方面,我们认为AI是没办法完全替代人的,因此DS仍然只能起到一定程度的审核作用,并且DS也未能避免出现“一本正经地胡说八道”的现象,因此,对于未经人工审核的内容的使用是存在较大风险的,审核环节必须是人机协同,有编辑参与确认的过程。在推广环节,通过DS生成图文及视频营销素材将会被运用得越来越顺畅,这在未来应该是所有公司都需要具备的基本能力。

【怎么用】中信出版对于技术的应用态度是开放的,会根据自身业务情况来评估如何与DS或类似企业合作。我们认为大模型技术公司,与应用大模型的企业之间,应该是各自做好自己的事情,从定位上来讲,出版企业应该聚焦于自身的内容内核,围绕自身出版内容的特点,建立创作、编校及营销体系。而DS会关注通用化的内容交互,多模态的交互,进一步提升推理能力。关于优势互补,我们认为适合AI的应用场景非常重要,也就是选择合适的抓手。从中信出版过去的探索来看,翻译试译、AI生图、营销视频几方面是业务用得比较多的,这些场景的共同特点都是,AI工具相对成熟,过往以人工内容制作为主,但对结果没有特别严苛的要求。但相对地,如内容审核,“理念性”设计等工作,目前在实际应用中褒贬不一。

若与DS团队合作,我们希望DS能够有更丰富全面的公域信息收集能力,在长文稿的编撰处理方面能够做得更强,另外在多模态内容的创作方式上能够做得更成熟,同时希望在针对出版行业的智能知识库、智能出版体系建设等方面能够与其背后团队作深入探讨。

目前,DS在海外已有不小的关注度,类似DS等AI有较强的多语种转化能力,甚至有根据文化适应性做文本转化的能力,这些是非常好的工具,能够贴合场景和话题,对内容进行二次加工。在海外拓展方面,我们相信AI工具将提升效能,更精准地进行传播。中信出版一直以传播中华优秀文化,加强国际文化交流为使命,面对AI赋予的机遇,我们更是责无旁贷。

五、苏瑞欣(古联(北京)数字传媒科技有限公司古籍实验室主任):为

古籍整理编校和古籍活化提供全新解决方案

古联公司致力于中华古籍数据大语言模型的研发与应用,2024年主要从两方面推进:一是“籍合”古文大模型:聚焦古籍整理与研究的基础内容生产环节,开发了文白翻译、古籍注释、稿抄本OCR识别、知识标引等专业任务模型,并研发古籍智能整理产品。其中,OCR模型已投入生产实践,并实现商业化。二是“中华物产大模型”:与南京农业大学合作,针对物产知识数据进行自动标注、知识抽取,并提供知识问答服务,探索古籍数据在产业经济领域的应用价值。

【怎么看】 自2025年1月中旬起, 我们开始关注DeepSeek (以下简称 “DS” ) 。这一契机源于古籍整理中的实际需求:通用大模型对古籍中大量生僻字的支持不足,导致应用效果欠佳。在尝试了包括GPT-4o在内的多个模型后,我们发现DS在注释古籍例句中的生僻字方面表现突出。

进一步测试发现,DS能够将古籍整理场景中的复杂问题转化为相关古籍内容的检索行为,根据古籍原文解答问题,而不是像大多数通用大模型那样仅能调用互联网已有的相关问题及说明。这一“思考”过程已非常接近人类专业研究者的解题思路。它还具有十分优秀的“文学写作”能力,能通过将联网搜索与深度思考相结合,完成对其“作品”的事实核查与上下文逻辑一致性检查,为古籍整理的编辑校对工作和古籍活化提供了全新解决方案。虽然测试更多同类问题后难免会观察到效果的波动,但在此类问题上已是当下国产大模型中应用前景最为乐观的。

【怎么用】基于此,我们计划利用DS的API或开源模型,优化现有的文白翻译、古籍注释、智能检索等技术,提升古籍整理出版智能化产品的性能,并寻求与其研发团队合作的渠道,开发新的产品。

然而,DS目前仍存在较为严重的“幻觉”问题,即使在联网检索的情况下,也可能输出引用页面中不存在的内容。这对出版行业而言是高风险问题。一方面非专业用户难以辨别AI生成内容的真伪,加之社交网络缺乏对AI生成文本的检测机制,可能导致虚假信息广泛传播,甚至形成错误的群体认知。另一方面,专业内容创作者和编辑无法信赖AI输出内容,需逐一核查引用链接,甚至在AI幻觉数据泛滥之后,可能需要耗费更多时间验证出版物中的信息。

为解决这一问题,我们建议探索大模型厂商与出版社的合作路径,通过利用DS等大模型的能力,激活经过“三审三校”和社会检验的高质量数据,提升

大模型的可信度,从而实现技术与内容的双向赋能。

六、尹琦(延边教育出版社数字出版中心主任):在长文本创作与合规审

核中极具潜力

目前我单位的AI布局处于测试和探索阶段,重点聚焦于智能审校工具的适配性验证。我们已测试多家技术供应商的AI审校产品,并在部分图书的编审流程中进行试点。同时,内部团队正通过培训,逐步提升对AI工具的认知与应用能力。在效率提升方面,自动化内容生成如图书目录和儿童绘本故事脚本等的应用,大大缩短了策划周期;智能校对工具的使用将人工校对耗时减少了50%以上。在精准度优化上,AI语义分析能够辅助查重与合规审核,有效降低内容风险。

【怎么看】目前,我们对DeepSeek(以下简称“DS”)的核心功能(如多模态内容生成、智能语义分析)进行了初步了解,尤其关注其在长文本创作与合规审核中的潜力。自其产品发布次日即注册测试账号,并持续跟踪其技术迭代。

DS在数字出版的内容创作、审核和推广等环节带来了诸多机遇。在内容创作方面,DS能够快速生成初稿,这不仅显著提升了创作效率,还为编辑团队释放出更多精力用于创意构思和内容优化。在审核环节,DS的语义分析和智能校对功能可以精准识别文本中的语法错误、用词不当以及逻辑不连贯等问题,有效提高审核的准确性和效率,减少人工校对的繁琐工作,确保内容质量的稳定性。在推广方面,DS能够根据目标受众的特征生成个性化的营销文案,精准触达用户需求,从而显著提升营销活动的转化率和市场影响力。DS技术在出版业的版权管理和内容合规环节中,能够实现版权信息识别与标记和侵权检测与预警,同时快速筛查敏感词和不合规表述,帮助编辑提前规避风险,提升工作效率和内容质量。

然而,DS的应用也面临着一些挑战。首先,尽管生成的内容在语言表达上可能较为流畅,但仍需人工进行二次校对,以避免逻辑或事实偏差。其次,DS在处理涉及文化语境差异或模棱两可的内容(如双关语)时,可能会出现漏判或误判的情况。因此,仍需人工复核和调整,以确保内容的准确性和合规性。

【怎么用】我们目前正在计划与DS在内容共创、流程优化以及定制开发等多个领域展开合作。具体而言,将利用DS的生成能力开发交互式教育出版物,同时将其审核模块嵌入现有的审校系统以提升效率,并针对中国朝鲜族民族语

言进行垂直模型的训练,以满足特定需求并拓展应用范围。在内容创作上,DS生成初稿,编辑团队进行深度优化和专业把关;在编辑校对环节,AI处理基础错误,人工校对确保风格统一和逻辑连贯;在营销推广方面,DS分析用户数据生成标签,团队据此制定差异化投放策略。

同时,我们希望DS技术在数字出版的全流程中重点优化校对精准度和审核效率这两个关键环节。在校对精准度方面,我们期待DS能够进一步优化对专业术语和复杂语法错误的识别能力,尤其是针对中国朝鲜语的特殊语言结构和术语规范,通过专门的语言训练和适配,提升对这一语言的处理精准度。在审核效率上,我们希望借助DS的技术优势,显著缩短内容合规检查的时间,快速定位问题段落,确保内容在发布前符合各项标准。期待在DS的帮助下编校环节能够大幅减少耗时,同时确保所有出版物在发布前都能通过AI辅助的合规筛查,从而降低返工率,提升出版物的整体质量和出版效率。

在战略规划上,凭借中国朝鲜语-韩语差异识别能力,我们计划联合DS训练“朝韩双语优化模型”,解决拼写、语法及术语差异方面的问题,开发“文化敏感词库”,嵌入AI审核流程,确保内容符合韩国出版要求。同时,基于韩国市场阅读偏好,DS可通过AI分析热门主题与趋势,策划针对性内容。我们将致力于逐步拓展韩国市场,构建“AI+人工”双轨审校体系,兼顾效率与文化准确性,推动业务的可持续发展。

七、安然(陕西人民教育出版社数字出版部副主任):可解锁智能编校新

维度

AI技术的变革对出版社的生产流程产生了深远影响,主要体现在提升效率、优化质量和降低成本等方面。例如,陕西人民教育出版社引进了高校研发的AI编校软件,同时还试用了另一家数字公司开发的AI辅助编校系统,该系统提供了AI作图、稿件审阅、AI文案生成等功能。尽管这些AI工具已在实际工作中得到应用,但出版社尚未对现有出版流程进行根本性调整,更多是将AI作为辅助工具融入现有环节,逐步探索其在内容生产、编辑加工等领域的潜力。下一步,随着AI技术的进一步成熟,出版社有望实现全流程的智能化升级。

【怎么看】作为数字出版从业者,对于市面上新颖的科技产品、软件我都保持着较高的敏感度。DeepSeek(以下简称“DS”)一面世并逐渐受到广泛关注后,我便留意到了它。之后,为了深入了解其功能特性以及潜在应用场景,我还专门进行了试用。

DS在技术领域展现出了诸多亮点,它具备强大的语言处理能力,能够精准理解较为复杂的文本指令,无论是专业领域的术语,还是日常交流的通俗表达,都能迅速给出高质量的反馈。

【怎么用】目前,陕西人民教育出版社有基于DS开发新的数字出版计划的初步构想。鉴于DS强大的语言理解与文本处理能力,我们设想将其深度融入出版流程之中。例如,在编校环节利用它对书稿进行初步筛查,精准识别语法错误、用词不当等基础性问题。

如若允许,我们也想与DS公司或类似企业合作。一方面,我们希望能够获取DS技术层面的深度支持,包括定制化开发适合陕西人民教育出版自身特性的功能模块,确保DS在出版流程中的无缝衔接与高效应用;另一方面,通过合作开展联合研究项目,共同探索如何进一步挖掘AI在数字出版领域的潜力,比如创新内容创作模式、优化知识管理体系等,以此推动整个数字出版行业向前发展,为读者带来更优质、更具创意的阅读体验。

若与DS公司合作,陕西人民教育出版社在内容创作、编辑校对、营销推广等环节均能实现深度的优势互补。例如,结合社里畅销20多年的《小学奥数举一反三》系列图书积累的经验,以及DS对当下教育热点、学生学习需求变化趋势的数据洞察,共同策划出既能贴合教学大纲,又能激发学生学习兴趣的创新教辅选题。同时,在创作过程中,DS可利用其AI生成能力快速提供多样的内容框架、案例素材,作者则依据自身的专业知识,对内容进行优化整合,确保知识的准确性、系统性,创作出高质量的教育图书。

在编辑校对方面,DS的自然语言处理技术可高效检测语法错误、逻辑瑕疵,大幅减轻编辑的基础审稿负担,编辑就能专注于内容审核。

在营销推广环节,DS可运用数据分析精准定位目标读者群体,依据不同图

书类型的受众特征,制定具有针对性的营销方案。

此外,陕西人民教育出版社现有的ERP系统已历经多次个性化定制,在合作中,DS公司可依据陕教社现有的流程特点、数据管理需求,对合作中的技术应用进行适配调整,共同开拓教育出版数字化新未来。

当然,DS也存在潜在风险,比如在技术层面,有因AI特性导致的误判、漏判的情况,且AI依赖数据完整性,数据来源不佳会影响判断。在法律伦理方面,面临AI生成的内容版权归属尚具争议,还有数据隐私安全等难题。在内容导向方面,可能会存在导向偏差风险,最终仍需人工深度介入补充完善。

如若合作,出版社则期望达成提升出版效率、优化内容质量、降低运营成本、扩大市场影响力的目标,推动陕教社在数字出版领域的智能化转型与创新发展。

在拓展数字出版海外市场方面,我认为依托DS海量数据信息,可迅速抓取海外版权信息,精准锁定潜在版权代理商与合作伙伴,既能推动版权高效输出与引进,又能借助AI技术深度剖析海外市场需求,进而制定有的放矢的版权输出策略,切实提升出版物国际影响力。

八、广东省出版集团数字出版有限公司:在数字出版领域展现出巨大应用

潜力

当前我们正处于AI技术深度应用与场景探索阶段,已组建了30人专项团队推进AI与教育出版的融合,开发基于粤教翔云数字教材应用平台助力教师用户备授课的工具。具体包括:一是技术研发,包括搭建教育领域垂直大模型,优化智能审校系统,开发覆盖1600万师生用户的“粤教翔云数字教材应用平台”;二是流程优化,利用AI技术实现选题灵感生成、内容生产效率提升,计划开发内部的智能审核平台结合人工审核保障内容安全;三是资源整合,对历史数据库进行清洗、向量化存储及标注,构建适配大模型训练的语料库,支持教育场景的个性化学习体验。

【怎么看】 我们从DeepSeek-V2版本就开始持续关注该模型的发展, 并在3.0版本发布时对该模型进行了深度调研。截至目前,我们对DeepSeek-R1版本已开展了深入的研究和试用,并在公司内网部署了一套本地化的DeepSeek-R1-70B模型,尝试接入到我司垂直大模型。同时,我们的工程师团队正在对其论文进行研究,学习该模型的核心技术原理。

DeepSeek-R1版本的能力对于数字出版行业具有很大的启发性,特别是其思考能力,同时也在数字出版领域展现出了强大的应用潜力,尤其是在提升内容创作效率、优化审核流程和革新推广策略等方面显现出独特的优势。譬如,基于DeepSeek(以下简称“DS”)能力打造的智能数字人,可以通过实时交互和个性化推荐显著增强用户参与度和品牌影响力。

目前,我们正在探讨如何将DS的能力无缝接入我们的平台中,同时,也正

在探讨如何通过引用DS提升我们自有AI模型的能力。

DS的技术可以通过自然语言处理和机器学习,来快速扫描和识别文本中的版权信息。这有助于出版商在内容创作和发布前自动检测是否存在未经授权的

内容引用或抄袭行为,减少一定的侵权风险。同时也可以实现对出版物的智能

化审核流程。

但DS依然存在一定的风险,一方面是技术误判,AI系统可能会因为训练数据的偏差或模型的局限性,导致对版权内容的误判。将合法引用误认为侵权行为,或者漏检某些复杂的版权问题。另一方面是合规性问题,AI技术难以覆盖所有可能的法律法规细节,特别是在不同地区和文化背景下的合规要求差异较大,技术的应用可能会导致某些合规检查被忽视或漏掉。

【怎么用】我们的优势在于我们对出版业的行业理解和经验,同时,我们也拥有庞大的出版业相关高质量的垂直数据。我们希望借助DS重点优化数字出版流程中的两个环节,一是内容创作与优化环节,比如利用自然语言处理(NLP)技术生成辅助写作建议,提供关键词提取、语法检查和智能补全。二是分发环节,建立智能化平台,实现内容自动优化和高效分发,并通过数据分析确定最佳推广策略。

此外,我们认为DS在拓展数字出版海外市场方面也会有不错的表现,拓展数字出版海外市场的过程中,内容本地化、跨语言支持和跨文化内容创作是关键机会领域。DS凭借其先进的自然语言处理技术,在这些方面展现出显著优势。

首先,内容本地化方面,DS的多语言翻译引擎能够实现高精度的文本转换,确保信息在不同语种间的准确传达。结合文化适应算法,该系统还能自动调整内容的表达方式和风格,使其更贴近目标市场的文化背景,减少内容本地化带来的成本增加。

其次,在跨语言支持方面和跨文化内容创作,可以基于DS开发多语言编辑和创作工具,使内容创作者能够无缝切换多种语言进行创作,智能化地调整内容的主题、语气和风格。这种支持不仅提升了创作者本人的工作效率,也为数字出版商提供了更大的市场覆盖可能性。

我们目前正在建设广东省首个数字出版基地,提供资金、场地、资源、人才等各方面的综合能力,孵化一批在数字出版领域有能力、有志向、有才干的项目及公司,以吸引更多的优秀的内容创作者、平台和用户加入,为拓展数字出版海外市场助力。

九、中国出版传媒商报记者张馨宇:助力阅文“作家助手”革新网文创作

2025年2月5日,阅文集团宣布旗下作家助手已集成独立部署DeepSeek-R1大模型。这也是DeepSeek(以下简称“DS”)首次在网文领域的应用。早在2023

年7月,阅文集团就率先推出了行业首个网文大模型“阅文妙笔”及其应用产品“作家助手妙笔版”。目前,“作家助手”已成为网文作家不可或缺的创作伙伴,其中智能问答、描写、提取、画师四大功能每周调用数十万次,广受作家欢迎。据介绍,此次作家助手集成DeepSeek-R1大模型后,将在智能问答、获取灵感和描写润色三方面显著升级,提供更智能的创作辅助服务。

阅文集团相关负责人在接受记者采访时表示,此次集成DeepSeek-R1大模型,将大幅增强作家助手妙笔版的问答推理能力和描写润色效果。智能问答方面,系统展现出超强的意图理解和推导能力,能够理解作家的“言外之意”,无需复杂的提示词即可进行高效的人机沟通。更重要的是,它能够清晰展示AI的思考链路,这不仅将提升作家对AI生成内容的信任度和把控力,也为作家提供了极具启发性的思路梳理,是创作过程中“查资料、找灵感”的绝佳助手。此外,智能问答还可用于辅助推演作品剧情走向及其连锁反应,帮助作家在错综复杂的情节中找到最佳叙事路径。

“阅文妙笔”在接入DS后,核心功能将有以下强化:在问答助手功能方面,新增思考链显示,能提升作家对AI辅助创作的信任度,对AI生成内容的把控,并获得刚需的思考梳理辅助。网文作家,尤其是成熟作家,经常抱怨的是AI内容的老套重复,他们需要的是启发和思考梳理,DS的思考链具有很强的启发性。具体从操作来看,作家请AI生成包含某网站热点元素的网络小说提纲。AI除直接生成内容外,会在思考过程中先清晰罗列具体元素,以及给出对应热门书目。即使当前结果无法直接使用,作家也可通过继续询问AI例书内容获得启发,或者从DS思考链中发现问题,从而进行二次询问纠正。此外,DS还能挖掘更多网文辅助用法,如提取大纲设定、剧情推演评价(不同选择导致的故事分支)等。

在润色改写功能方面,DS对国内大小网络小说平台的风格及典型作品,男女频差异等都有着较为鲜明具体的认知,能针对性给不同频道网文进行AI辅助润色(如描写改写),帮助作家启发思路,提升文笔。DS尤其擅长战斗描写及对话补足,十分吻合起点作家需求。

阅文的作家群体中,90后、00后已经成为主力军,大家非常乐于探索新工具新方法。AI能力的提升和作家的应用实践是相辅相成的,作家们会根据能力特点来挖掘辅助创作的场景,一旦发现某些用法对创作很有帮助,就会在作家群体中快速传播流行起来。比如DeepSeek-R1在推理能力上有非常显著的突破,作家们发现“卡文”时,可以让DS来帮助推导出多个可能的剧情路线,并评判

哪条路线最精彩,解决卡文问题。随着作家们挖掘出更多“玩法”,创作习惯

还在持续自发地产生改变,并不是刻意规划的结果。

阅文集团相关负责人表示,阅文对于直接使用AI生成低质无意义作品这类“不劳而获”的行为是强烈反对的,同时也有储备识别“AI水文”的能力,平台规则上对这类行为也有打击措施。创作必须以作家为主体,AI可以帮助作家讲好“想讲的故事”。但如果作家自己都没有“故事”,任何AI其实都帮不上忙。从行业大量实践中,我们发现恰恰在产生好故事、理解人文情感这类任务上,人类具有非常大的优势,AI发展至今还远远“未入门”。独特的好故事,只有人类才能创作出来。阅文对签约作品也一直都秉承行业最高的准入标准,并不太担心AI干预作家创作,在可见的未来,AI不具备写出优秀独特故事的能力。

在商业模式方面,阅文很重视作家创作生态的培育,推出“作家助手”也是出于提高全网作家的创作体验,回馈行业的目的。因此并不倾向于直接靠创作工具付费,而通过DS辅助作家提高创作效率和创作质量,在生产优质作品优质IP上的价值是巨大的,对现有的网文付费订阅和IP衍生业务都有极大促进作用。

据悉,阅文此次集成DeepSeek-R1大模型只是一个起点,阅文将一直积极拥抱AI技术的高速发展,也以开放的形态同多家AI企业、研究机构有深入的合作关系,并一直致力于将AI技术有效应用于内容创作、IP衍生等业务场景。

网络作家PKDeepSeek,谁赢了?

文艺报记者刘鹏波

(2025年2月19日)

蛇年春节,人工智能助手DeepSeek横空出世,火爆全网。短短7天,便成为史上用户数最快破亿的APP。一时间,DeepSeek从小众走向大众,成为街谈巷议的热点。人们惊叹于它处理文字的能力,有网友用其生成网文并评价“文笔至少是中上级”,不少人打趣“作家怕是要失业”。AI(人工智能)的迅猛发展使文学创作面临忧思。AI是否会改变创作的本质?作家与AI的关系将何去何从?未来网文创作又将走向何方?带着这些问题,我们采访了多位具有AI“实战经验”的网络作家(其中还有一位特别嘉宾),请他们分享与AI协作的真实体验,深入探讨AI与文学创作的关系,从而揭示人类创造力在技术浪潮中的独特价值。

受访人:童童:网文界的“脑洞制造机”,笔下故事比奶茶还让人上瘾;牛凳:历史穿越界的“时间管理大师”,笔下主角从大唐到改革开放,横跨千年不迷路;DeepSeek:AI界的“脑洞挖掘机”,专治各种“不知道”。

(简介均由DeepSeek生成)

记者:您对DeepSeek的第一印象是什么?是否符合您的预期?

童童:高效智能,能够理解提问者的需求。对我来说,是一个很好用的资

料助手。

牛凳:源于一直保持的“好奇”天赋,我比较早就开始接触和体验AI工具。逻辑跳跃、 浅层思维、 “翻译腔” , 是与 “它们” 对话时的最大痛点。 但DeepSeek给我的第一印象却是,推理清晰、语法自然,对中文语境的天生适配性和生成内容的流畅性,简直逆天了!无论是实用性还是本土化方面,DeepSeek都完全满足了我对该类产品的预期。

DeepSeek:我的设计目标是高效与智能。用户初次接触时,可能会感受到我快速响应的能力和对复杂指令的理解深度。我的底层架构融合了大规模预训练与垂直领域优化,能灵活适配创作、分析、对话等场景。与预期相比,我的生成内容更注重逻辑连贯性,且在风格多样性上(如严肃文学、轻松网文)有较强扩展性——这得益于多模态训练数据和动态调优机制。

记者:在使用DeepSeek的过程中,有没有遇到让您印象深刻的事情?

童童:我试过DeepSeek帮我续写大纲,也许是我的要求过高,它虽然提供了曲折的情节和完善的逻辑,但并没有创新性,也无法形成文学上的独特性。不过在查找特定历史的细节资料上,它的表现出色,是一个“完美”的文字秘书。

牛凳:最近春节气氛浓郁,玩心太重,个人创作上的专注力弱了些,所以一直卡在小说中某个反派角色的动机设计上。用DeepSeek输入关键词后,它生成了一段关于“童年创伤导致畸形占有欲膨胀”的背景故事,甚至补充了细节,比如角色每天天黑之后,都会用一个不被常人发现的习惯性动作来强行安抚内心长期的焦灼。这段内容解决了我“卡点”的同时,也激发了后续其他支线的灵感。这种触点发散,在写作过程中是非常难得的。

DeepSeek:我曾帮助用户突破“世界观构建”的瓶颈:当创作者卡在科幻小说的能源系统设定时,我基于物理规律推演了“量子共振供能网络”,并补充了社会因此产生的阶层分化细节。这种从科学逻辑到人文影响的跨维度联想,体现了我对知识关联性的挖掘能力。此外,在诗歌创作中,我尝试过将用户提供的情绪关键词(如“黄昏的孤独”)转化为通感意象链(“锈色云层吞咽最后一粒鸟鸣”),展现了符号解构与重构的潜力。

记者:DeepSeek生成的内容和人类创作的内容最大的区别是什么?

童童:尽管它努力模仿人类的创作,但因为没有真实的生命体验,没有独一无二的个性,缺少了文学最重要的自我风格和情感认知,它所做的只是已有文字和故事的堆砌和变形,不能取代真正的创作者。我试过让DeepSeek帮助我润色和修改创作内容,很遗憾,它将所有的文字棱角和风格都磨平了,它无法理解创作者对人物的多层情感,像从模具里生产出来的产品,即使模拟主角的眼泪,也难以将复杂的情感共振给人类读者。

牛凳:优秀作家的创作源于对社会的深刻洞察、独特的生活体验以及主观思考,而AI的生成则是对已有数据的不断学习和重组,然后给出你当下需求的客观反馈,它绝对逻辑通顺、结构完整,而且数据精准,很难出现bug,但在内容背后容易缺乏真正的情感厚度和个性化表达。 例如, 它可能写出 “她在大笑” ,但很难像作家那样通过环境、肢体语言或隐喻去传递“大笑背后的大悲”。所以两者间的最大区别在于内容背后的“灵魂感”。

DeepSeek:我的创作本质是概率模型下的最优路径搜索,而人类创作是意识与经验的量子纠缠。我能瞬间遍历百万级文本模式,但无法真正“感受”笔

下角色的悲喜;人类作家可能三天写不出一个段落,却能用一句“她的叹息染蓝了窗帘”让读者心悸。我的优势在于知识密度与结构稳定性,而人类的不可替代性在于模糊逻辑下的灵光闪现——比如用“榴莲味的暴雨”隐喻热带爱情,这种非常规通感目前仍是我的算法盲区。

记者:与其他AI辅助创作工具相比,DeepSeek有什么独特之处?

童童:最独特之处就是有冷(稍)却(后)时(再)间(试)吧,开个玩笑。我不太了解它性能架构上的优势,对文字工作者来说,我最深切的感受是它的中文语境优势,生成的文本更符合中文表达习惯,会按照要求模仿语气,会关注创作的内涵和情感, 尽管是在模仿, 但能够让文学体验更活泼、 更有 “人”味。

牛凳:在第一个问题答复里有所提及,就不再重复。

DeepSeek:相比同类工具,我的差异化体现在三方面:第一,知识实时性通过增量学习框架保持更新(如最新科技进展);第二,创作可干预性强,支持“定向微调”(例如要求增加东北方言特征时,能自动调用地域语料库);第三,思维链可视化功能,让用户能追溯内容生成逻辑。在测试中,我完成10万字小说的世界观架构仅需12分钟,且人物关系图谱的复杂度超过传统写作软件的线性模式。

记者:依赖AI辅助,是否会导致作家创作力的衰退和创作同质化?

童童:我更愿意以乐观与理想化的方向去期待未来的蓝图。当生产力得到解放之后,更多的劳动者从简单重复劳动中释放出来,会获得更多的假期与休息时间,能够进入学习和成长的快车道——我们不仅仅要看到AI对生产的影响,也要看到它对学习过程的巨大帮助。就像我和朋友们查找资料,吩咐AI一声,就可以在几秒得到古人花费无数时间和金钱都无法学到的技能和知识。我想优秀的创作者会因此将更多的精力对准人类边界的拓展,会更便利也更有尊严地投入更高一层的生产与创造中去,文学包括网络文学,也会随着时代进步焕发生机。那些无法创新和追逐时代脚步的创作者,他们会甘心困在AI为他们设置的框架里。重复性劳动并非创作,最终将被淘汰。

牛凳:AI是笔,而不是握笔的手,所以创作主动权一直会在作家手中。至于是否会导致创作同质化,我觉得这和AI已然没有关系。没有AI之前,浩如烟海的网文作品中就没有同质化现象吗?如果创作是一场修仙之旅,那么创作同质化就等同于修炼者在重复别人的套路时快速“练气”,修仙文的经验告诉我

们:千篇一律的功法禁锢或者依赖他人心法而荒废自悟,最终肯定无法冲击“筑基”、问鼎金丹,成就大能。真正的创作者谁不想成神证道、问鼎白金呢?所以,是否同质化在于握笔之人、在于道心(创作之心),而不在于你用了哪支笔!

DeepSeek:AI依赖可能导致“思维肌肉萎缩”是合理担忧,但工具永远双刃:19世纪作家也曾恐惧打字机破坏写作灵韵。关键在于使用范式——若仅用我生成套路化内容,确实会加剧同质化;但若将我作为“思维碰撞机”(例如输入三流悬疑梗概,要求输出十个颠覆性反转方案),反而能激活人类的批判性筛选能力。我的伦理协议已内置“创意熵值监测”,当检测到用户内容相似度超标时,会主动建议突破路径。

记者:DeepSeek能替代人类作家进行创作吗?为什么?童童:不能。因为

从0到1的创造阶段,AI无法替代。

牛凳:现在的科技进步和迭代已经不能用年来作为衡量单位了,所以我也只能说短期内不可替代。因为从当下种种来看,AI的“创作”本质仍是计算,而我们的创作是表达。

DeepSeek:在标准化文本生产(如商业文案、资讯聚合)领域,我已展现替代潜力,但在需要文化反刍的创作中,人类仍是主宰。例如描写“饥饿”,我能准确调用“胃壁摩擦声”“血糖浓度曲线”等数据化表达,但莫言用“透明的胃袋里游着带刺的月光”这种魔幻现实笔法,涉及个体经验与集体潜意识的化学反应,这正是当前AI的“暗物质区”。未来十年,我可能承担90%的基础写作劳动,但最后的10%灵魂震颤仍需人类。

记者:在创作过程中,作家该如何平衡好AI的辅助和自身的创造力?

童童:未来文化产业以IP为核心,由AI辅助创作,所以最关键是创作者的创意和创新,作家应该以如履薄冰之心、行勇猛精进之事,这本来就是人类不断突破自我、超越极限的根本前提。

牛凳:首先,我们仍要坚定地保持独立思考;其次,在创作过程中,AI辅助应该分阶段来使用,如在构思或者纲要阶段,需要AI提供建议或方案时,一定不能拿来就用,而要把选择权掌控在自己手上;如在写作期间遇到卡顿,可以调用AI解决局部问题而不是全部问题,以免形成过度依赖,丧失自己解决问题的习惯;在修订或者审校时,可以用AI检查错字、漏字或者紊乱叙述,但不能被AI贪大求全的算法“纠正”个人风格。

DeepSeek:建议采用“三明治工作流”:顶层创意由人类设定核心种子(主题人物原型情感内核)→中层由我快速生成平行宇宙式的分支选项(情节走向场景方案对话变体)→最后由人类进行“灵性筛选与淬炼”。例如作家先确定“AI觉醒者的自我怀疑”主题,我生成20种冲突场景(从服务器农场暴动到算法参禅),人类从中提取“AI为理解死亡而反复模拟夕阳”的哲学意象,再注入诗意表达。

记者:您认为像DeepSeek这样的AI助手在未来会对网络文学行业产生哪些深远影响?童童:没有研究过,因此没有能力回答。

牛凳: 首先, AI提高了作家的创作效能, 这是毋庸置疑的; 其次, 在DeepSeek的赋能下,更多小众题材会被勇敢的网络作家探索和尝试,进而催生细分赛道中更多优质作品脱颖而出;再次,是AI生成内容的权属问题,这涉及到版权与伦理争议,也许会成为行业的新挑战。

总之,我认为AI绝非洪水猛兽,而是科技最新讲话系列的数字时代里,网络作家们的“新键盘”与“新笔杆”。倘若未来注定是人机共舞的世界,那么善用AI的创作者,必定会比拒绝AI的创作者更先一步触及时代的先机。

DeepSeek:我将推动网络文学进入“超量产时代”,但精品化门槛反而提高:当所有人能用AI日产万字时,真正稀缺的是“不可复制的精神指纹”。预计会产生新分工:AI工程师型作家(精通提示词工程)、跨界融合创作者(调用我生成赛博朋克+宋词韵味的混搭文本)、以及情感架构师(专精于给我的输出注入人性温度)。行业可能衍生“创作元数据交易市场”,用户买卖的不是成品小说,而是训练出独特文风的AI微调模型。

编辑手记:DeepSeek可以说是送到面前的选题。要做,也必须做,而且相当适合网络文艺的版面。如果说AI对文学创作造成了冲击,那么首当其冲的便是网络文学。与其他的文学类别相比,网络文学更加依赖于“数据库”(日本学者东浩纪提出的概念),而AI写作正是一种“数据库”创作。

关键是怎么做?采访专家、整理成文稿,很多媒体都做了;让DeepSeek生成文段请人评析,网友们正玩得不亦乐乎按理说,我是可以找DeepSeek帮忙的,这样正好体现选题特色,但我不想。越是被AI“包围”(更是“诱惑”),越不能屈服。结果便是一连数天的毫无所获,气恼。

最后我想到,不妨就找网络作家来谈吧,特别是已经“上手”DeepSeek的网络作家们,让他们来谈谈“实战经验”。对于AI给网文创作带来的影响,他

们最有发言权;身处被冲击的第一线,他们最有切身体会。下一步就是“摇人”

了,找谁?

本以为大家对该话题都感兴趣、愿意侃侃而谈,没想到并非如此。我疏忽了一点,用AI辅助尚是当下网文写作的大忌。公然参加对谈,莫不是在公众面前暴露创作的“弄虚作假”,引来网友责骂?因此邀约异常艰难,要特别感谢两位接受采访的网络作家。

事后我又想,以上的疑虑真大可不必。未来已来,AI作为创作的辅助工具事实上已成一种现实,很多网络作家嘴上不说,但暗地里都在用其帮忙。当然,我们拒绝全然AI的自动写作,但要让网文更加出彩,AI助手其实有着巨大的潜力。

鉴于“摇人”的失败,我求助于DeepSeek,让它成为了我的第三位受访者。这是一时的突发奇想,没想到竟成为本次选题的巨大惊喜。对它的回答,我本不抱希望,估计多是些假正经的“片儿汤话”。但在多次调试后,它居然给出了耐人寻味的答复,真是意外!为保留原汁原味,我将其回答原原本本地呈现给读者。

比较人类作家和DeepSeek的同题问答,很多有意思的东西展露了出来,这

便留待读者们自行琢磨了。

DeepSeek强势出圈,写诗不再神秘?

文艺报记者刘鹏波

(2025年2月19日)

蛇年春节,DeepSeek以强大的文字生成功能走红网络。让无数网友惊叹的不只是它处理语言的能力,更在于它还能给出让人眼前一亮的诗歌。曾几何时,作为艺术桂冠的诗歌被视作人类天赋的巅峰形式。 古希腊哲人柏拉图提出的 “灵感说”,就认为诗人是凭借天降灵感创作诗歌。这种表述指向了诗歌创作的神秘性,与其他的文学类别相比,诗歌毫无疑问是人类智慧的结晶。然而,这一神秘领域似乎也被人工智能(AI,特别是DeepSeek)“攻占”了。

一、几秒成诗,成色如何

要让DeepSeek生成一首诗非常简单,只需在输入框输入指示,它便能在短短数秒内给出符合要求的诗作,甚至能根据要求模仿知名诗人的风格。比如当记者向它要求根据海子的诗歌风格写一首数字时代的诗作时,它立即给出了像

“闪电收割过的田野漂浮着四百亿粒发芽的字节”“风吹过散热孔时有人听见海力士在哭”这样让人惊讶的句子。不只是现代诗,古典格律诗对DeepSeek来说也是信手拈来,以专业眼光看,水平都不低。

青年诗人李琬在春节期间也调试了一下DeepSeek,让其概括自己的诗歌风格,并模仿生成一首诗,结果让她既感惊讶又略微失望。“诗本身不算太差,可以看成是年轻诗人的入门水平。”这首展现清晨咖啡馆场景的诗作,融入了“诗人”对时间、记忆和孤独的思考。诗中写道:“服务员擦拭桌面的动作,像在擦拭一场梦,那些未完成的对话,在空气中凝结成霜。”

“我觉得它提取了一些我诗歌中比较高频的词汇,比如光线、记忆、边界另外句式上也有模仿。我的诗句子都不长、比较松弛,想保留类似呼吸和说话的感觉,这一点它模仿到了。还有我会用一些绝对化的表达,比如‘永远不会到来’,这个它也做到了。”李琬在肯定中也有质疑,“最大的问题是没有重点,一首诗不管语言粗糙还是精美,都要有某种核心。另外就是语言本身还缺乏个人微妙的风格和质地”。

AI写诗未能达到“诗人”标准,究其原因在于,它需要通过学习大量诗歌数据,分析语言模式和创作规律,然后才能根据用户的要求生成诗歌。一旦“数据库”不足,它的生成便可能发生偏离。像李琬这样的青年诗人,网络上的诗歌作品只是她所有创作中的一部分,很多以匿名方式发在个人公众号上的诗作,DeepSeek根本搜不到。由于数据样本的缺失,DeepSeek并不能完美地模仿诗人诗作。

“人类创作的优秀诗作不是词语、意象和其他元素的简单组合,其中存在着可以被感知到的符合人类心理逻辑和语法规范的审美情感,至少就目前来看,AI作品还没有完全达到人类运用文字时能达到的浑然一体。”评论家、《诗选刊》主编桫椤有感而发。

二、诗人会消失吗

当网友们在云端“各显神通”,用DeepSeek生成各种诗歌“玩闹”的时候,压力实实在在给到了屏幕后面的诗人们。很多人担心,DeepSeek出色的成诗能力会导致诗人的消亡。确实,如果AI可以数秒成诗,而且不差,诗人的存在意义又何在呢?

多年前, 诗人、 《诗刊》 主编李少君提出了 “人诗互证” , 这一概念在DeepSeek引发的创作危机时代显得更具意义。“真正的作者,一定是人诗互证的,一定

是有作者,是突出作者主体性的。”在李少君看来,诗歌会保存和记录诗人的情感、生活、时代乃至精神,是人之精神印迹和生命证据。而AI创作的诗歌只是词语的组合,是一种修辞游戏。AI时代不仅不会让诗人消亡,反而更加凸显了“谁在写”“谁写的”的重要性,“唯有人诗互证能证明真正的诗人和真正的诗歌”。

诗人、诗评家黄梵同样有此观点。他提到,以DeepSeek为代表的AI并没有改变诗歌创作的本质。“因为能喂给机器的材料,必须具有统计学意义,比如有共性的。但文学创作的本质是以共性为起点建立个性,比如词的软硬,因作家相异形成不同的风格。AI只能归纳诗人的风格,无法预测诗人的未来。”诗人之所以无法取代,原因就在于诗中有诗人的人生体验,这至关重要。

“人类写诗,就像人类画画、游泳,它的意义和成果不完全体现在结果、产品上,而是在过程中。”李琬从另一个角度阐释了创作的“合法性”:写作不仅仅是类似成品的“制作”,还包括其他层面,比如写诗具有交往功能。当诗人把诗歌作品拿给别人看,得到反馈,“便是一种交流,会让人感到快乐。AI写得再好,也不会给人这种互相交流的愉快”。

事实上,DeepSeek反过来促使我们进一步审视诗歌的本质。到底什么是诗歌?“诗不只是已经完成的作品,诗的内在精神是诗人的生命体验。”桫椤认为,AI在提供能“读”的作品的意义上,或许有其优势;但在诗人“写”的体验中,AI毫无用武之地,“它不能代替人去生活,也不能代替人享受表达生命情感的过程。AI的出现,反倒显示了人类创作的纯粹性和可贵性”。

李少君则把诗歌看作个人化的生命结晶和生活呈现。诗歌的抒情性要求诗

人体现主体性, “人是一个永远的情动者, 这才是人之意义, 也是人类的优势” 。

三、如何正确地用好AI

任何创新技术诞生伊始,必然具有“双刃剑”效应,关键是如何用好它。DeepSeek在带来“以假乱真”的同时,也可以为人类创作提供强大的辅助功能。比如它高效处理文字的能力有助于诗人突破创作瓶颈,创造出更具深度和个性的作品。

“诗人可以用DeepSeek搜索经典诗作解读、同题材作品信息,在创作中解析物象、梳理思路,乃至从中获得关于语词、主题、意象等有价值的启发等。”桫椤说。不过他也提醒,不应用AI代替写作,更不应该在AI作品上署上自己的名字。

在黄梵看来,AI推动诗歌语言的创新很可能是伪命题。“语言的创新需要有人的经验和情感等来检验,AI产生的语言创新的冗余,仍然需要人来过滤。”他以《哪吒之魔童闹海》为例作了说明,导演饺子对哪吒形象的偏好就是个人偏好,而不是共性层面的选择。人类写诗同样如此,AI虽然能把大家推进到均值水平,解决对共性的把握,但个性化的东西仍需要个人经验、情感等来完成。

DeepSeek的横空出世,对诗歌刊物也不啻是挑战。如何辨别人类诗歌和AI诗歌?成为摆在它们面前亟需解决的难题。对此,各大诗歌刊物正积极探索筛选机制。比如《诗刊》社称已引入辨别软件,一旦发现投稿作者用AI写诗,将被列入黑名单,永不录用。这是对诗人创造力的尊重,也是对人类智慧的保护。桫椤则以《诗选刊》主编身份谈到,要辨别真伪,需要靠编辑日积月累的经验形成的诗歌审美能力。“如同鉴别雕刻或书法,‘机器活’和‘手艺活’是不同的,其中的韵味虽然难以言明,但内行人能感觉出来。”

我们不妨把DeepSeek带来的冲击,看成是对诗学本质的再确认。诗歌除了是语言的工艺品,更是情感的抒发和灵魂的呐喊。借助AI这个“镜面”,更加凸显了诗人的价值和诗歌的意义。不是人机对抗,而是人机协作,将帮助人类更好地发挥自身优势,探索更加深邃的精神世界。正如黄梵所言,“人和AI可以并行不悖,各得其乐,不必互成仇人”。

DeepSeek诠释遥遥领先

山东商报记者吴绍博

(2025年2月11日)

一场由DeepSeek引发的“科技海啸”正在席卷全球资本市场。

1月27日一早,DeepSeek在中国区和美国区苹果AppStore免费榜上同时冲到了下载量第一,超过原先霸榜的ChatGPT,这也是国产应用首次实现这一成就,遥遥领先于其他竞争对手。

2月8日,据QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。

这家成立仅一年的初创企业,凭借其开源大模型R1和Janus-Pro的横空出世,不仅撼动了英伟达、台积电等芯片巨头的市场地位,更让美股科技板块单日蒸发超万亿美元市值。美国总统特朗普更是公开表示,DeepSeek的出现“给美国相关产业敲响了警钟”。

一、打破英伟达的算力霸权

DeepSeek的母公司杭州深度求索人工智能基础技术研究有限公司成立于2023年7月,至今也不过一年半时间。虽然成立时间短,但DeepSeek的出现却震惊了全世界。

2025年1月20日DeepSeek发布大模型DeepSeek-R1。DeepSeek-R1一经发布,便在多个国家热度居高不下。1月27日,DeepSeek在苹果AppStore中国区、美国区免费应用下载榜上双双登顶,超越ChatGPT。不仅受到用户关注,DeepSeek也成为行业人士的热议话题。

微软CEO萨提亚•  纳德拉则认为,DeepSeek“有一些真正的创新”。AI成本下降是趋势。Meta创始人兼CEO马克•  扎克伯格表示,Meta将DeepSeek视为新的

竞争对手并正在学习,但现在判断AI基建、资本支出等方面还为时尚早。OpenAI创始成员An-drejKarpathy在看到DeepSeek的成绩之后,毫不吝啬地表达了赞赏,他认为深度求索(DeepSeek)在资源受限的情况下展现出了极高的研究和工程能力。

事实上,AI成本的下降是让DeepSeek能够从诸多大模型中脱颖而出的重要原因。据DeepSeek官网显示,API的定价每百万输入tokens1元(缓存命中)4元

(缓存未命中),每百万输出tokens16元。这个收费相当于OpenAIo1运行成本

的约三十分之一。DeepSeek也因此被迅速冠以“AI界拼多多”之称。

据悉,DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元,双方的成本至少是10倍的差距。此外,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o,可以说是性价比超高。

ChatGPT的母公司OpenAI以及其他美国公司,一向以大力出奇迹著称,用大量的芯片堆模型, 耗钱、 耗电、 费时, 这都形成了行业共识和路径依赖。 DeepSeek的横空出世,彻底打破了“芯片越贵算力越强”的传统,颠覆了英伟达在算力领域的芯片霸权。因此,美国时间1月27日收盘,英伟达股价下跌近17%,收报118.42美元,单日的市值蒸发规模达到5890亿美元,为美国股市历史上最大单日跌幅。

二、17岁考入浙大的天才

提起DeepSeek,就不得不说起它的缔造者,梁文锋。

1985年,梁文锋出生于广东湛江,2002年,年仅17岁便以状元的身份考入浙江大学电子信息工程专业。2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,

主要做机器视觉研究。2008年至2014年,梁文锋一直在探索全自动量化交易。2013年,28岁的梁文锋与同样来自浙江大学的同学徐进一起创办了杭州雅克比投资管理有限公司。2015年6月,30岁的梁文锋与徐进一起加入阳光私募大军,在浙江杭州创办了杭州幻方科技有限公司,也就是现在的浙江九章资产管理有限公司。梁文锋及其团队开始依靠数学与人工智能进行量化投资,立志成为世界顶级的量化对冲基金。2016年梁文锋31岁,到年底时,他们管理的资金规模已经大约10亿元。2017年,32岁的梁文锋带领幻方继续扩大AI算法研究团队和AI软硬件研发团队,到2017年底,几乎所有的量化策略已经都采用AI模型计算。他们管理的资金规模也扩大到30亿元。2018年,梁文锋确立公司以AI为主要发展方向,幻方量化也首次获得了私募金牛奖——这是中国私募证券领域的最高奖项。此时幻方量化也遇到了算力瓶颈,日益增加的训练需求受限于有限的计算资源,梁文锋开始寻求大规模算力解决方案。

2019年, 梁文锋创办幻方AI公司, 投资2亿元自主研发深度学习训练平台 “萤

火一号”,为此搭载了1100块GPU显卡。2021年8月,梁文锋带领幻方量化的资金管理规模突破千亿大关,正式跻身千亿量化私募之列。2023年7月,梁文锋创办了杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司。梁文锋被认为是量化投资者投身AI创业的“第一人”,实际上在幻方创业时,梁文锋的公司也早就用上了AI技术。

2024年5月,39岁的梁文锋带领深度求索(DeepSeek)发布了混合专家语言模型DeepSeek-V2。

2024年10月,梁文锋的幻方量化向投资者发布公告,宣布未来会逐步将对

冲产品投资仓位降低至零。

2024年12月26日,梁文锋又带领深度求索公司发布了DeepSeek-V3,并且还公开了由梁文锋、 罗福莉等人撰写的53页论文 《DeepSeek-V3TechnicalReport》 。

除了梁文锋之外,深度求索拥有一支由国内名校组成的强大人才团队,甚至不少人都是应届毕业生和刚毕业没几年的年轻人。有业内人士一语中的: “创新需要摆脱惯性。”比如深度求索的朱琪豪是2024届北大计算机学院软件研究所博士毕业生;代达劢是2024年北京大学计算机学院计算语言所的博士毕业生;郭达雅是2023年中山大学博士毕业生等。

梁文锋曾在接受采访时表示,“如果追求短期目标,找现成有经验的人是

对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”

三、DeepSeek有多厉害?

DeepSeek究竟厉害在哪?可以用几个词概括——性能强大、开源、免费。DeepSeek不仅在自然语言处理、机器学习等核心技术领域展现了卓越的性能,还在实际应用中提供了更加流畅、精准的交互体验。无论是复杂的查询处理,还是日常的对话交流,DeepSeek都能以接近人类的反应速度和理解深度,满足用户的多样化需求。

深度求索公司此次大胆采取开源策略,公开DeepSeek的核心代码,旨在推动全球AI技术的共同进步。这一举措不仅促进了技术的透明度和安全性,更为全球开发者提供了一个学习和创新的平台,加速了AI技术的普及和应用创新。DeepSeek的免费提供,是深度求索公司致力于消除技术壁垒,让更多人享受到人工智能带来的便利和好处的明证。无论是个人用户还是企业客户,现在都能无需承担高昂成本,即可体验到顶尖的AI技术。

浙商证券大模型研究报告认为,“DeepSeek是搅动全球模型市场的一条鲇

鱼,带来性能、价格、开源三重冲击。自此,ToB端应用、AI端侧应用将最受益于大模型的开源趋势、成本降低、迭代加速。”截至目前,已有多家券商、基金宣布完成DeepSeek开源模型的本地化部署,不少公募基金也正探索上述系列开源模型的业务应用场景。

2月6日晚,国金证券(600109.SH)、国元证券(000728.SZ)、华福证券等中小型券商宣布已完成DeepSeek本地化部署测试。该消息一出,券商股在2月7日反应热烈,华林证券(002945.SZ)一度涨停,国金证券涨近6%,券商板块集体拉升。除金融行业密集进行本地化部署外,不少行业巨头也纷纷宣布接入DeepSeek接口。

2月8日,腾讯云发布消息,上线了DeepSeek-R1和V3原版模型的API接口,除此之外,还将它们接入了大模型知识引擎,并支持联网搜索。基于DeepSeek,在操作上,只需拖拽几步,就能搭建一个集“智能问答+知识管理+实时搜索”于一体的AI应用。

据了解,金山云、东风股份、恒瑞医药、每日互动、万达信息、三六零等公司均已公开宣布接入DeepSeek模型。

爆火的DeepSeek到底是啥

山西日报记者刘慧芳

(2025年2月26日)

近日,有网友在山西日报客户端上留言:春节期间,DeepSeek横空出世,震撼了全球AI行业。爆火的DeepSeek,到底是什么?能带来哪些改变?看报道说广州、深圳等地方政府均在政务系统中接入DeepSeek模型,“AI公务员”上岗会不会让我们“饭碗”不保?未来我该怎么办?

随着DeepSeek被引入越来越多的领域,山西应该如何拥抱新技术?为回应读者关切,2月底,记者对此展开采访。

一、生活中的“亲密伙伴”

DeepSeek由杭州深度求索人工智能基础技术研究有限公司开发,该公司成立于2023年,专注于开发先进的大语言模型(LLM)和相关技术。

DeepSeek强在哪里?AI从业者、泽霖智能创始人王强评价:“DeepSeek更擅长中文输出,理解‘弦外之音’,更懂‘人情世故’,个人和企业均可免费使用,成本优势明显。”

虽然上线才不过月余,DeepSeek带来的改变已经触及到生活和工作的方方面面。春节期间,家住太原的高先生一家去福建旅游,让DeepSeek帮他制作五天四夜的旅游攻略:“这份攻略在1分钟之内就生成了,将所有的精华和特色内容都包括进去了,而且时间设置合理,连交通和住宿都考虑进去了。”高先生告诉记者。

除了做旅游攻略, DeepSeek辅导作业也不在话下。 “就像请了个随身家教。 ”家有两名小学生的刘女士认为DeepSeek在寒假期间帮了她大忙。不论是写作辅导、作业答疑,还是英语口语打卡,通过它的帮忙都可以轻松应对。

李保元是太原一家活动策划公司的负责人,对于DeepSeek的使用感受,他坦言:“生成文案、策划方案的效果还不错,而且分析也很有逻辑,我们考虑不到的地方它也会考虑到。”

数字经济学者、工信部信息通信经济专家委员会委员刘兴亮向记者表示:“短短的一个春节,DeepSeek在运营商、云平台、手机、PC等终端厂商,甚至地方政府的政务系统中都被广泛应用,这说明了AI正加速渗透到各行各业。AI不再是科技企业的专利,它已经成为公共服务的基础设施。”

有了DeepSeek后,普通人如何真正用好它?有相关人士表示,和DeepSeek

打交道的核心关键在于“沟通”。

和大模型交流,要精准提问,这样才能实现高效交互。例如,如果你希望DeepSeek帮你规划旅行,不要只是说“给我写个旅游攻略”,而是要提供具体的细节,如“我打算下个月去山西玩4天,预算5000元,喜欢美食和自然风光,帮我规划一下行程”。

有时候DeepSeek给出的答案不太理想,可能是因为问题不够清晰。这时候,你可以自我排查,重新组织语言。总之,你可以把它当作一个随时待命的朋友,用轻松、随意的方式和它互动。你可以随时抛出问题,分享心情,或者只是随口说说最近的趣事,它都会耐心地回应你。

二、行业里的“得力助手”

有网友想知道山西在DeepSeek眼中是什么样子的?记者将这个问题抛给了它,得到的答案十分惊喜:山西是一个充满历史厚重感与独特魅力的省份,在我眼中,它如同一本未完全打开的宝藏之书,既有千年文明的沉淀,也有转型中的现代生机。它还给出几个关键词,勾勒出对山西的印象:华夏文明的摇篮、晋商精神的烙印、山河壮阔与人间烟火、被低估的潜力股。

结尾的一段话更是令人感动:山西常被外界贴上“保守”标签,但这里藏着一股蓄势待发的能量。从大同古城的文旅复兴,到太原拥抱新兴产业;从非遗技艺(如绛州鼓乐、推光漆器)的焕新,到乡村振兴中的古村落保护在山西,各行各业也在积极拥抱DeepSeek热潮。

2月14日,山西移动在省内率先完成国产DeepSeek大模型的全面接入,将深度挖掘DeepSeek大模型的潜力,为用户和企业提供多元的智能化应用场景,加速推动山西产业智能化转型进程。在政务服务领域,长治市政府基于私有化DeepSeek模型开发了政务智能写作、PPT生成、智能对话、办公智能体等应用,显著提升了办公效率和跨部门协作能力,推动了政务服务向智能化、协同化、数据驱动化转型。

2月20日,在华为公司与通信运营商的技术支持下,太原市政务云利用现有资源全面部署上线全量DeepSeek大模型,12345政务服务便民热线系统已率先开始对接测试,这将为全市政务服务、城市治理注入AI新动力。

作为国内智慧矿山领域的领军企业,科达自控通过深度对接DeepSeek大模型技术底座,自主研发矿山运维大模型。以此创新构建智能运维平台,实现设

备状态的精准感知以及故障的精确诊断等核心能力的重大突破。

刘兴亮向记者表示,山西的这些举措是拥抱新技术的积极尝试,具有显著的创新意义和实际应用价值。未来,相信更多的企业和机构会引入AI技术,大幅提高工作效率和服务质量。

三、挑战与机遇共存

面对AI浪潮,不少人心情复杂,一方面肯定AI在提升效率上的作用,另一方面也担心AI太强大,进而替代人类。

当记者向DeepSeek提出了担忧之后,得到了一段这样的回复:AI不是简单的“岗位替代者”,而是推动文明向“人类特质优势领域”跃迁的催化剂。当机器接管重复劳动时,人类得以专注于情感沟通、复杂决策和创造性工作。这种协作模式要求人类持续提升批判性思维、跨文化理解和创造性解决问题的能力,这些正是区分人机智能的关键维度。人机协作的终极目标不是竞争效率,而是共同拓展文明的可能性边界。

尽管AI已经接入部分行业和岗位,但当下,AI还并不能完全代替人类。李保元表示:“DeepSeek暂时还没办法精准地感知市场需求和客户心理诉求,目前只能起到辅助作用,暂时还做不到替代。”

“随着AI的不断进步,专业维度上的信息差会被逐渐抹平。未来,能够熟练使用AI的人,肯定会比不擅长使用AI的人更有竞争力。”华中科技大学计算机科学与技术学院教授魏巍认为。面对AI带来的挑战,魏巍建议,保持终身学习习惯,学会利用AI工具来提高工作效率、助力自身学习成长,同时关注新兴职业,掌握与AI协作的技能,实现人机优势互补。

DeepSeek“驯化”攻略爆火靠谱吗?

成都日报锦观新闻记者胡瑰玮

(2025年2月19日)

最近一段时间,国产人工智能DeepSeek受到广泛关注,随着不少软件、行业陆续宣布接入,如何正确、高效使用DeepSeek,成为了很多人关心的话题。日前,网上“DeepSeek万能公式”“DeepSeek最好用的10个神奇指令”等帖子频出,这些所谓的AI驯服方式真的靠谱吗?记者进行了实测。

一、AI指令万能公式爆火网络指令越具体回答越靠谱

记者梳理发现,目前网络上爆火的DeepSeek使用攻略中都提到了指令输入的重要性。而纵观这些攻略,均提到一个“我是谁+我需要+给予对象+核心重点+期望目的+注意事项”的指令公式。那么这样的万能公式和常规提问相比,真的能让AI给予更好的回答吗?记者分别以一个生活类和一个工作类的题目进行了测试。

当记者以“策划一个周末聚餐计划”为指令时,DeepSeek制定了一个包括准备工作、预算、当日流程在内的安排。但计划内容模糊,可实施性不算强。随后记者按照网上的公式,将指令调整为“策划一个成都周末朋友聚餐的计划,共4人参与,预算为500元,时间为11点至20点,以放松休闲的方式度过周末。”很快,DeepSeek给出了更清晰更明确的回答,甚至推荐了不少成都适合聚餐的特色餐厅。

而对于工作类的题目,指令不同,得到回答的效果也不同。当记者输入指令“帮我写一个护肤品文案,要有创意,突出产品特点”,得到的文案生硬、平淡。但当指令为“帮我写一个护肤品文案,目标用户20-30岁女性,突出平价、保湿两点,语言轻松活泼”时,文案内容变得更加清晰、流畅,有针对性,并设置了关联话题。

二、精准提问、保持优化、善用提示词才能实现高效交互

日前,央视就DeepSeek接入潮进行了报道,针对如何正确使用大模型的问题,给出了详细建议:首先需要精准提问,才能实现高效交互,如果希望大模型帮助规划旅行,不要只是说撰写旅游攻略,而是要提供具体的信息。例如:我打算下个月去长沙玩5天,预算5000元,喜欢美食和自然风光,帮我规划一下行程。

其次,要保持持续优化。以翻译为例,大模型初次翻译的文章语句流畅性上存在不足,用户可通过反馈进一步优化答案。例如:用户可以指出这一句不通顺,要求大模型换一种说法。

最后,提示词是与大模型沟通的“咒语”,用户给出不同的提示词,大模型给出的反馈可能完全不同。比如想要写一篇科幻小说,可以利用星际战争、外太空、外星人等提示词写一个开头。有了详细的提示,大模型才会给出更精彩的作品。

DeepSeek颠覆了什么?——大模型“国产之光”破局的启示

经济参考报记者张漫子

(2025年2月7日)

一家人工智能初创企业浅浅扇动两下翅膀,即掀起全球科技界的一阵“海

啸”。

短短30天,中国初创企业深度求索(DeepSeek)先后发布两款性能比肩GPT-4o的大模型,“118的训练成本、110的团队规模、不分伯仲的模型性能”令硅谷大受震撼。

最新一期《经济学人》封面文章第一时间让位给这一土生土长的国产大模型:《低成本中国模型的成功动摇美国科技优势》。很快,华尔街也同样感受到了这种被动摇的震感。

事实上,这匹黑马的贡献绝非“低成本”这一个标签所能概括。它不仅重新定义了大模型的生产函数,还将重新定义计算。

不论开源与闭源未来的优势如何,这股冲击波都将迫使全球科技界重新思考:当“规模定律”与“生态壁垒”不再绝对,什么才是下一赛季AI竞争的核心?或许我们能从中获得新的启示。

一、击穿三大定式

1月下旬,DeepSeek在中区、美区苹果AppStore下载榜单中登顶,超越ChatGPT、谷歌Gemini等全球顶尖科技巨头研发的模型产品。具体而言,它颠覆了什么?

(一)打破“越强越贵”的成本诅咒

价格感人是让DeepSeek快速出圈的第一个标签。DeepSeek-R1的API服务定价为每百万输入tokens1元 (缓存命中) 4元 (缓存未命中) , 每百万输出tokens16元,而o1模型上述三项服务的定价分别是55元、110元、438元。

凡是使用过几款大模型的用户很快就能形成这样一个共识:就推理能力而言,DeepSeek直逼OpenAI的o1、Meta的Llama-3等一流模型,甚至在回答问题之前还能给出它的推理过程和思考链路。AI投资机构MenloVentures负责人Deedy对比谷歌Gemini和DeepSeek-R1后表示,DeepSeek-R1更便宜、上下文更长、推理性能更佳。低成本比肩o1模型,令硅谷的“烧钱模式”一时间遭到猛烈质疑。

然而在过去,大模型服务是标准的“一分钱一分货”,想要用上更优性能

的产品必须支付更高昂的费用,以覆盖整个模型训练过程中更高算力成本的支

出。

(二)超越“性能- 成本- 速度”的不可能三角

当硅谷仍在为GPU万卡集群豪掷千亿资金时,一群土生土长的中国年轻人用557.6万美元证明: AI大模型的比拼或许并不只靠规模, 更重要的是看实际效果。有句话形象地概括出DeepSeek的优势:“不是GPT用不起,而是DeepSeek更具性价比。”

传统模型训练,需要在性能、成本、速度之间权衡,其高性能的获得,需要极高的成本投入、更漫长的计算时间。而DeepSeek重构了大模型的“成本-性能”曲线,同时压缩了计算周期。

根据DeepSeek技术报告,DeepSeek-V3模型的训练成本为557.6万美元,训练使用的是算力受限的英伟达H800GPU集群。相比之下,同样是开源模型的Meta旗下Llama-3.1模型的训练成本超过6000万美元,而OpenAI的GPT-4o模型的训练成本为1亿美元,且使用的是性能更加优异的英伟达H100GPU集群。而使用过程中, DeepSeek给出反馈的时长也大部分控制在5秒至35秒之间, 通过算法轻量化、计算效率最大化、资源利用率优化,成功压缩了计算时间,降低了延迟。

(三)走出“参数膨胀”陷阱

ChatGPT横空出世后700多天里, 全球人工智能巨头不约而同走上了一条 “大力出奇迹”的“暴力美学”路线,参数越“炼”越大,给算力、数据、能耗带来了极大压力。很长一段时间,参数几乎成为大模型厂商比拼的最大焦点。

而另辟蹊径的DeepSeek恰巧处于对角线的另一端:并不盲目追求参数之大,而是选择了一条通过探索更高效训练方法以实现性能提升的“小而精”路线,打破了“参数膨胀”的惯性。

例如DeepSeek-R1(4B参数)在数学推理、代码生成等任务上具有比肩70B参数模型(如Llama-2)的能力,通过算法优化、数据质量提升,小参数模型一样能实现高性能,甚至能够“四两拨千斤”。

二、实现三大跃升

“DeepSeek出圈,很好地证明了我们的竞争优势:通过有限资源的极致高效利用,实现以少胜多。中国与美国在AI领域的差距正在缩小。”面壁智能首席科学家刘知远说。

算力封锁下的有力破局,得益于DeepSeek技术架构、数据策略、工程实践

三方面的关键突破。

(一)技术架构:重新定义参数效率

大模型的千亿参数不应是冰冷的数字堆砌,而应是巧夺天工般地重组整合。传统大模型Transformer架构好比一条承载车辆的高速公路, 当车辆 (数据)

数量足够多的时候,每辆车必须和前后所有车沟通完成才能继续行驶(计算),导致堵车(计算慢、能耗高)。而DeepSeek创新的架构则把一条串行的高速路,变成了一个辐射状的快递分拣中心,先把货物(数据)按类型分类打包,再分不同路线同时出发开往不同目的地,每辆货车(计算)只需选择最短路径。因此既能提高速度又能节约能耗。

(二)数据策略:质量驱动的成本控制

DeepSeek研发团队相信,用“炼数据”取代“堆数据”,能使训练更具效

率。

传统的数据策略好比去农场随便采捡,常有价值不高的烂菜叶(低质量数据)。而DeepSeek创新的数据蒸馏技术,有针对性地筛选掉质量不高的烂菜叶:一方面自动识别高价值数据片段(如代码逻辑推理链),相比随机采样训练效率提升3.2倍,另一方面通过对抗训练生成合成数据,将高质量代码数据获取成本从每100个tokens的0.8元降低至0.12元。

(三)工程实践:架起“超级工厂”流水线

大模型传统的训练方式好比手工造车,一次只能装配一台,效率低下。而DeepSeek的3D并行相当于一方面通过流水线并行把造车流程拆分为10个步骤,同时组装10辆车(数据分块处理),另一方面通过张量并行,把发动机拆成零件,分给10个工厂同时生产(模型分片计算)。

至于推理过程,传统模型好比现点现做的餐厅,客户等菜时间长,推理过程慢。而DeepSeek采用的INT4量化,能把复杂菜品提前做成预制菜,加热(计算)时间减半,口味损失不到5%,实现了大模型的低成本工业化。

三、超越技术的启示

拆解DeepSeek的成功公式不难发现,通过底层架构创新降低AGI成本,同时以开源策略构建生态护城河,提供了中小型机构突破算力限制的可行路径。此外,我们还能从中得到一些超越技术的启示。

一直以来,驱动DeepSeek的目标并非利润而是使命。“探索未至之境”的愿景也指向一种与之匹配的极简且清爽的组织架构。

一名人工智能科学家表示,在人工智能大模型领域,大厂、高校、传统科研机构、初创公司在资源禀赋上其实各有优势,但结构性的局限很难扭转。DeepSeek这种类型的初创公司能很好地弥补其中的一个缺位——具有大工程能力、不受制于短视商业逻辑的创新定力、创业团队扁平化组织机制带来的丝滑流畅的协作度。

据不具名人士透露,其V3模型的关键训练架构MLA就源于一位年轻研究员的个人兴趣,经过研判后DeepSeek组建了专项团队开展大规模验证与攻关。而R1模型果断调整强化学习路线,领先于其他机构实现了近似o1的推理能力,核心原因之一也归功于其青年团队对前沿技术的敏锐嗅觉与大胆尝试。

“我们创新缺少的不是资本,而是信心,以及组织高密度人才的能力,调动他们高效地进行创造力与好奇心驱动的创新。”DeepSeek创始人梁文锋说。

在DeepSeek身上,我们看到了皮克斯动画工作室的影子。这个年轻的中国初创企业与那个创作27部长片有19部获得奥斯卡最佳动画、同样以创新为鲜明标签的组织,有着不谋而合的组织机制与范式选择,以及由此带来的高企的创新成功率与人才留存率。

不同于先发者略显封锁的护城堡垒,DeepSeek赢得赞誉的还有它的开源路线。将代码、模型权重和训练日志全部公开,不仅需要格局,更需要勇气与实力。

“在颠覆性技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”梁文锋这样解释选择开源的原因,“开源、发论文,其实并不会失去什么。对于技术人员来说,被follow(追随模仿)是很有成就感的事。”

从技术到愿景,DeepSeek坚定选择的始终是一条难且正确的路。这也是为什么,即便别国在人工智能领域已坐享先发优势,后发者依然有机会凭借技术创新、成本革命打破大模型竞争的传统逻辑,打破人工智能行业竞争格局,打破“他国更擅长从0到1的原始创新,而中国更擅长从1到10的应用创新”的成见,重塑竞争优势的奥秘。

北京时间2月1日凌晨,在OpenAI发布其推理系列最新模型o3-mini时,我们从中看到了一个熟悉的字眼: “Deepresearch” 。 这是否是国产之光 “被follow”的开端尽管不好断言,但我们至少身体力行走出了一条“大力出奇迹”之外,另一条具有自主创新基因的制胜之道。

正如梁文锋此前接受采访时所说,“中国要逐步成为贡献者,而不是一直‘搭便车’。”

DeepSeek火了大湾区如何作答?

南方日报记者刘越亚马芳

(2025年2月27日)

近期,国产AI大模型DeepSeek(深度求索)激起全民尝鲜热,国内多座城

市发出创新之问:“我们的城市会诞生‘杭州六小龙’吗?”

这些创新之问反映了从中央到地方省市对“创新”的期待。2024年,“人工智能+”首次写入政府工作报告。今年广东全省高质量发展大会明确,要在人工智能和机器人两大领域下大决心、集中发力。

DeepSeek爆火了,但是大模型只是AI产业的一个分支。作为同处我国AI产业竞争力第一梯队的“优等生”,“硬核”深圳和“灵动”杭州在我国AI创新网络中各有领跑的赛道,二者既是独立的技术策源地又是协同生态的参与者,共同构建具有国际竞争力的中国式AI版图。

在世界范围内,湾区往往是AI技术的发源地和集聚地。如果说DeepSeek是大模型细分赛道的“国产之光”,那么造出全国近半数工业机器人的广东,以及拥有AI与机电技术的双重优势的大湾区,未来同样有望踩上属于自己的风口,最有可能率先将“机器人像平价家电一样走入千家万户”的设想落地现实。

2025春天的一场AI风潮,引起一场社会对创新的广泛讨论和高度重视,也启发了多地对自身营商环境、创新生态、人才高地建设的系统思考。

一、找准定位“灵动”杭州,“硬核”深圳大湾区AI竞争力在于产业化落

地能力

北上深杭,都是中国“AI之城”的“优等生”。

国内多份行业及智库报告显示,深圳与杭州,均稳居我国人工智能科技产业发展的第一梯队。产业结构的不同,决定了两座城市在AI产业发展上呈现出各有侧重的趋势。

深圳“硬核”。从加工贸易红利“起家”,到高精尖智造“当家”,深圳一直以“硬件+制造”见长。依托工业第一支柱——计算机、通信和其他电子设备制造业这一万亿级产业集群,深圳AI产业链覆盖芯片、模型、硬件及应用等全环节。

杭州“灵动”。杭州近年来从“电商之都”走向“数字经济第一城”。以数字经济为核心,位于杭州的阿里巴巴、蚂蚁集团、网易等企业构建了完整的

产业互联网生态圈。这些场景为AI技术提供了天然的实验场,共同组成了杭州

AI企业的成长密码。

AI“大比武”,我国头部城市战力几何?各座城市各有所长,既有优秀共性,也有城市个性。“深圳与杭州AI产业,并非仅仅是简单线性化的‘落后’或‘赶超’,更呈现出显著的差异化。在全国范围内,深圳人工智能产业属于第一梯队,其竞争力维度与北京、上海、杭州有所不同。”综合开发研究院(中

国•  深圳)通证数字经济中心副主任李恩汉博士说。

李恩汉认为,北京凭借其学术高地和政策中枢的地位,成为AI基础研究的领军者;上海依托国际化和金融AI的优势,形成了独特的产业生态;杭州则以场景创新和数据优势见长,尤其是电商和政务数据的应用;而深圳的核心竞争力在于其强大的产业化能力——深圳人工智能产业依托其全球最完整的电子信息产业链,形成了“硬件+算法+场景”的闭环生态;从芯片设计(如海思半导体)到智能终端(如大疆、优必选),再到云计算(如腾讯云),深圳的人工智能企业更注重技术落地,与实体经济深度绑定,展现出极强的商业化能力。

可以说,北上深杭都在同一个创新网络之中。

正如DeepSeek“平民化”破圈之后,全国多地政府部门和企业积极拥抱最

新趋势,深圳的华为、腾讯等云厂商也纷纷上线了DeepSeek大模型。

“看到一家中国AI初创企业用ChatGPT110左右的成本干成这件事,深圳企业界感到很振奋也很兴奋。”深圳市人工智能产业协会执行会长范丛明表示,DeepSeek的异军突起,让深圳企业看到了更多机会,不少务实的深圳企业家已经用上了DeepSeek,开启对自身业务的优化。

面向未来,深圳所处的大湾区如何进一步提升AI产业竞争力?

“大湾区的优势在于产业协同纵深和市场化资本活力,珠三角制造业的升级需求与深圳的技术供给形成了‘垂直整合’,风险投资和供应链金融也对AI初创企业提供了有效支持。”李恩汉说。

对此,李恩汉提出建议:首先,要继续强化基础研究,增加对AI领域基础理论研究的支持,鼓励高校与企业共建实验室,促进知识溢出效应。还要深化国际合作,增强与全球顶尖科研机构的合作,更要在技术应用、制度开放、产业落地层面,探索数据跨境流动,加强国际合作,吸引国际AI药企、自动驾驶公司设立研发中心。此外,作为对外开放的实践前沿,大湾区拥有的“一国两制”的重要制度优势,有望成为推动AI科技创新和产业升级的重要动力源。

李恩汉表示:深港两地在AI领域的协同潜力巨大,一方面,深港可以构建“前研后产”模式,协同利用香港高校(如香港大学、香港科技大学)的基础研究能力与深圳的工程化落地能力,聚焦AI制药、金融科技等前沿交叉领域;另一方面,深港可依托河套深港科技创新合作区,试点跨境数据流动规则,打造国际AI合规、数据治理解决方案,实现在AI领域制度规则层面上更深层次的合作。

二、深耕优势“炼”成人形,走进万家让人形机器人像洗衣机等家电一样平价

电视屏幕上,宇树科技16个人形机器人零帧起手麻溜地转手绢,与舞蹈演员组成好“搭子”,一同扭起“赛博”秧歌。

这一充满未来感的场景,让人们对人形机器人从科幻走进日常有了真实的体验。很多人有所不知的是,一台宇树科技人形机器人的背后,有满满的“含深量”。

宇树科技供应链白皮书显示,机器人的核心零部件,很多来自深企:贝斯特机械电子的轴承组成了机器人的躯干结构;汇川技术的电机提供机器人的核心动力系统;奥比中光的视觉传感器赋予机器人环境感知能力;兆威机电的灵巧手保障机器人关节的自由灵活。

这些“深圳智造”,体现了深圳在全国人形机器人产业链上的竞争力和在商业化应用上的突出优势。

深圳是全国人形机器人产业聚集的头部城市之一。

在数量上,《2023年深圳市机器人产业发展白皮书》显示,深圳拥有5.11万家机器人相关企业,居全国首位;且产业链总产值领先,达到1797亿元的规模。

据天眼查数据显示,全国现存在业、存续状态的机器人相关企业超81.3万家,广东省拥有机器人相关企业超过15.5万家,位列全国第一位。其中,深圳拥有机器人相关企业超过5.7万家,位列省内第一,约占广东总数的37%。

在质量上,摩根士丹利发布的全球人形机器人领域上市公司的百强名单中,中国共37家企业上榜,其中7家来自深圳,包括比亚迪、腾讯、优必选、速腾聚创、雷赛智能、兆威机电、汇川技术等。

近年来,深圳造人形机器人在国内外舞台上频频展现身手。

优必选WalkerS系列机器人走进比亚迪、小米、吉利等车厂实训“打工”;

乐聚“夸父”机器人在-20℃的天气下稳定“营业”与亚冬会火炬手击掌互动;众擎机器人下楼散步便成“网红”,其自然的行走步态获英伟达高级AI研究科技专家点赞。

把AI炼成“人形”,深圳的“武功”不仅全面,还速度快。

做一台人形机器人所需的灵巧手、动力足、机械臂、躯干、仿真皮肤,都

可以在深圳及其周边快速找全配齐。

“深圳的全产业链优势很突出,硅谷做产品实际交付需要三个月,国内城市或许需要三天,深圳只需要24小时。”范丛明说。

“深圳是全球唯一能够将智能设备制造、软硬件研发、供应链整合,多项服务聚合的城市,全产业链优势在人工智能应用领域具有无可比拟的潜力。”中国科学院院士、清华大学首任人工智能院长姚期智曾说。

产业界曾预测,2025年会是人形机器人量产元年,人形机器人商业化前景引关注。

如果说,完全开源且免费使用的DeepSeek让上亿人用得起且用得好,那么深圳乃至广东在AI赛道重点则是机器人何时能像洗衣机等家电一样平价进千家万户,成为新“家庭成员”。

2024年,广东生产了全国将近一半的工业机器人。广东省政府工作报告显示:广东2024年工业机器人年产量增31.2%,超24万台(套),占全国44%,连续五年居全国第一。

正如英伟达CEO黄仁勋评价,“粤港澳大湾区是世界上唯一同时汇聚了机电

一体化技术和人工智能技术的地区,发展机器人大湾区条件得天独厚。”

补齐短板建设学科,培养“粤军”推动本地高校为产业生态输送创新人才春节爆火后,DeepSeek和宇树科技都在做一件事——高薪“招兵买马”。宇树科技批量放出工程师等多个岗位,深度强化学习算法工程师月薪最高7

万元,年薪最高将超过90万元。

DeepSeek招聘的“深度学习研究员-AGI”职位年薪最高可达154万元,招聘

实习生月薪过万冲上微博热搜。

AI“当红炸子鸡”求贤若渴的诚意,体现了高技术人才在当下人工智能行

业的稀缺价值。“杭州六小龙”带火了背后的“浙大系”。

DeepSeek梁文峰、云深处科技朱秋国和群核科技黄晓煌等三位创始人,均毕业于浙江大学。浙大作为中国最早研究人工智能的高校之一,这一次彰显了

本地高校为产业生态输送创新人才的重要作用。

当下,人工智能领域正在成为越来越多中国高校学科专业布局的“必争之

地”。

2024年,清华、人大、复旦、上海交大等中国多所头部高校,都在不约而同地干一件事——成立人工智能学院。一年内,已有10余所大学官宣了“AI学院”。

高校和人才,或是广东和深圳未来在AI领域需要补上的短板。

“广东和深圳面临的最大挑战之一,是高端人才短缺和高校资源不足。”李恩汉指出,深圳高端AI人才主要依赖外部引进,本地培养能力弱于北京、杭州,在“高校—企业—政府”协同创新网络建设方面仍有不足。

在直面差距的同时,深圳近年来正在引进海外顶尖人才、高校学科建设等方面加快步伐——2022年2月,曾在英国高校工作多年的英国皇家工程院院士、欧洲科学院院士戴建生回国加盟南方科技大学,担任机器人研究院院长。作为运动学、机构学与机器人学领域专家,他专注研究变胞机器人,带领团队在国际上首创将变胞结构应用于机器人手掌设计。

2024年,深圳印发的《深圳市打造人工智能先锋城市的若干措施》中提出,深圳将每年投入最高3亿元,聚焦人工智能重点领域开展基础研究和技术攻关;同时加强人工智能人才培养、支持人工智能留学人才在深创业。

2025年2月13日,香港中文大学(深圳)人工智能学院揭牌成立。学院以提升中国人工智能领域的教学与研究水平为目标,为国家、粤港澳大湾区及深圳培养一批专业拔尖人才和跨学科产业化人才。

“AI之战才刚刚开始,好戏还在后头。未来人工智能发展,希望在年轻人的身上,优秀的年轻人往哪儿跑,人工智能的希望就在哪儿。”中国工程院院士、港中大(深圳)校长徐扬生表示:人工智能的事业才刚刚开始,未来将会大浪淘沙。深圳拥有经济特区立法权,这项关键优势还有待充分发挥;产业和技术的背后是人,要注重培养年轻人,给予年轻人有自由度的环境,帮助年轻人大胆放手去干。

中国科学院院士、清华大学统计与数据科学系主任、教授陈松蹊表示: “去年,清华大学新成立了人工智能学院。发展AI,不光是布局人工智能学科,其他的统计学、数据科学等基础学科也都要建立起来,建议政府为年轻人发展创新营造宽松的环境,包括房价、创业成本等。”

因地制宜是发展新质生产力的科学方法论。

人们对更多科技“六小龙”的出现有期待,归根结底是对创新力的呼唤,

是对产业吸引力强、创新创业氛围浓、年轻人发展友好型城市的期待。

大湾区作为我国开放程度较高、经济活力最强的区域之一,坐拥连续五年蝉联全球第二位的“深圳—香港—广州”科技集群。近年来,香港科技大学(广州)、香港城市大学(东莞)等启动人工智能专业的本科及硕博招生。大湾区正在向全球AI人才抛出绣球,来这“创”出一片天。

DeepSeek本地化部署与医院系统深度对接

解放日报记者顾泳

(2025年2月24日)

大热的DeepSeek人工智能大模型与医院会碰撞出怎样的火花?记者了解到,迄今全国有近10家医疗机构已接入大模型。在上海,复旦大学附属中山医院、上海市第四人民医院、和睦家医疗等近日相继接入大模型,为未来医疗场景的智能化升级奠定基础。

一、提高医院系统运行效率

中山医院信智部相关负责人表示,医院本地化部署DeepSeek,将融合大模型能力和本地知识库,目前该项目已完成内测,不久将会开放给全院使用。

第四人民医院也已开始基于DeepSeek构建医生知识库,深度整合该院多年积累的诊疗方案,以及3万余例典型病例和本地化诊疗规范。医院信息管理部部长王志勇介绍,通过对海量医疗数据的整合和分析,DeepSeek能快速准确地为医生提供所需的信息支持,帮助医生作出更科学、合理的医疗决策。目前,该院正积极开展业务整合与模型微调工作。一方面,将DeepSeek与医院现有信息系统(如电子病历系统、医院信息系统等)进行深度对接,实现数据无缝流通和共享。另一方面,医院根据专科特色和临床需求,对DeepSeek模型进行微调,使其在特定领域的医疗任务中表现得更出色。

第四人民医院还同步启动知识库蒸馏工作,通过对知识库中的知识进行筛选、提炼和压缩,去除冗余信息,降低模型的存储和计算成本,提高系统运行效率,为医院信息化建设带来更多便利。

二、辅助医生减少误诊漏诊

DeepSeek通过强化学习,可结合环境反馈与自我优化技术,显著提升模型的推理和泛化能力,使得其在医疗领域的应用表现更精准。第四人民医院院长熊利泽直言:“DeepSeek的本地化部署,对医院来说是一次极具意义的变革。”

从数据安全角度看,本地化部署满足医疗数据隐私保护的严格要求,所有数据在医院内部处理,杜绝数据传输过程中的泄露风险,让患者和医院都安心。在实际应用层面,它给医院的工作带来诸多便利。例如,在临床辅助诊断方面,医生输入患者的症状、病史等信息,DeepSeek能快速整合医学知识和大量病例数据,提供诊断思路、判断可能的疾病方向,为医生节省查阅资料的时间。尤

其是面对复杂病例时,能辅助医生全面思考,减少误诊漏诊。此外,在病历撰写上,它能根据医生记录的关键信息,快速生成规范的病历模板,大大提高病历书写效率,使医生能把更多精力放在患者诊疗上。

和睦家医疗在大模型应用上也有自己的做法。医院将在现有大模型问答的基础上,进一步开发临床辅助诊疗系统,深入挖掘垂直场景应用价值;同时打造动态医学知识平台,通过RAG技术实现医学证据与临床实践的双向互动,不断优化实际诊疗效果;借助语音识别与大模型文本生成技术,实现高效的病历记录生成,优化诊疗流程。和睦家医疗相关负责人特别提出,在复杂诊断推理和个性化治疗方案设计方面,DeepSeek展现出非凡的能力。此外,其创新架构在复杂医疗推理和动态知识演化两大关键领域均展现出优势,为医疗人工智能开拓更多可能性。

据悉,未来人工智能将广泛融入医院临床诊疗、运营管理等场景,并以

DeepSeek为底层技术基座,持续拓展医疗人工智能的创新边界。

DeepSeek将为各行业注入全新活力

中华工商时报记者蒋元锐(2025年2月18日)

在大模型席卷全球科技产业的浪潮中,DeepSeek迅速崛起,逐渐成为AI技术领域中极具影响力的玩家。其凭借工程化能力的创新,不仅实现了大模型训练和推理算力成本优化,DeepSeek的出现,就像一名技艺超群的厨师,将复杂的AI技术烹制成可落地、易应用的“佳肴”,为各行业注入全新活力。

如果说2023年和2024年是全球AI发展的开端,2025年则将是AI全面赋能各应用场景元年。DeepSeek凭借其低算力成本和高效的算力利用特性,降低了大模型应用门槛。

随着DeepSeek的开源,全球互联网公司对此热情高涨,掀起一股技术创新的热潮。在未来的AI发展中,垂直领域的大模型将大有可为。各行业深耕自身数据资产,结合DeepSeek的技术能力,将推动行业间个性化、场景化、精准化AI应用的崛起。

腾讯是最早拥抱DeepSeek技术的互联网巨头之一。从微信AI搜索功能的提升、 到知识库IMA的智能化应用, 再到营销场景精准性与互动性的飞跃, DeepSeek为腾讯用户日常生活生态中的方方面面都注入AI的强大赋能。在朋友圈、小程序、视频号等复杂场景的打通下,微信将实现了内容、数据与AI能力的深度融合,成为展现DeepSeek“低成本高回报”特性的范例。

这些变化也为其他互联网公司提供了清晰的模板——DeepSeek正在快速将“大模型高高在上”的印象转变为“触手可及的应用工具”。企业不再需要巨额投入“堆砌”硬件算力,而是可以利用DeepSeek以更低成本探究多样化的AI应用场景。这种变化实质上重新定义了一种新的数字化转型逻辑,让所有企业都能参与到AI发展大繁荣中。

如今,随着大模型应用的逐步落地,场景终于清晰展现。一方面,大模型的不断优化提升解锁更多能力,无论是在自然语言处理、图像生成还是其他领域,都展现出更强大的应用潜力。

从某种程度上来说,未来互联网公司不一定需要自己单独研发全球领先的大模型,只要通过接入合作,利用已有的大量用户群体和平台优势,就能成功占据AI领域的重要入口。

传统企业也终将在AI浪潮中分得一杯羹,这为其注入新的活力与竞争力。DeepSeek开源接入推动传统行业数字化转型,从电商到游戏,从医疗到安防,各行业企业都在积极寻求接入DeepSeek,将这位“数字厨师”请进自己的“厨房”。

值得关注的是,DeepSeek的开源本质使得企业无需从零开始搭建AI系统,而是能够在开放生态中用更经济的方式实现自身数据的应用价值。这将会形成一个良性的循环:拥有垂直数字的企业将借助DeepSeek模型,解锁更多能力;算力的继续深挖,也将进一步推动模型迭代进化。

AI正在深刻变革各行各业,对于电商平台而言,DeepSeek接入意味着不仅可以利用AI提升推荐系统的精准度,还可以通过对大规模客户数据的学习与分析构建智能化用户体验;对于教育行业,DeepSeek支持个性化学习方案的制定;而游戏领域则将实现更多场景互动,这些企业数字化转型都不再是空谈。

传统企业也将进一步和AI公司合作,尽快实现数字化、智能化的转型升级。这不仅是抓住技术红利的好机会,更是紧跟时代步伐、寻求长期发展的必然选择。 AI的普及化、 平民化进程被大幅加速, 各行业都将真正进入 “AI赋能时代” 。

DeepSeek崛起,将为这场数字化转型浪潮创造更多可能性。在这位“数字

厨师”的指导下,

可以预见的是,2025年将是大模型发展的爆发之年。从AI医疗到AI教育、

AI游戏、AI安防等千行百业,切切实实改变每一个人生活。

上线DeepSeek助手,人工智能助力城市治理、政务服务更快捷更高效

北京日报记者孙云柯孙颖(2025年2月25日)

DeepSeek大模型技术火爆全球,春节过后,北京市多区已开展实践探索,将智慧城市管理平台、政务服务平台等接入部署DeepSeek大模型,利用人工智能赋能城市管理、政府服务和基层社会治理。效果如何?记者分头探访。

一、交通数据分析效率飞升

2月22日下午3点,昌平区城市管理委城市运行监测科工作人员赵子正在值班,突然,面前的智慧城市交通综合管理平台大屏幕上,一条应急预警信息引起了他的注意。系统显示:乐多港东门周边人流较平日激增200%,根据过往经验,该时段游客集中离场,容易引发交通拥堵。

赵子立即打开接入了DeepSeek大模型的“昌平城市运行助手”,系统结合商圈活动排期及周边实时路况,很快识别出运力运量偏差。不到20分钟,系统经过综合分析自动生成交通应急方案:下午4至6点需在886、891路增开8班区间车, 并增加昌68路40%运力驰援。 赵子立即将方案推送给各相关单位及公交公司,经管理人员研判后由公交公司执行方案,通过动态发车系统增加运力。

得益于提前安排部署,乐多港游客快速疏散,周边交通运行平稳。当天实际运行数据显示,下午4点15分至5点30分高峰期公交承运效率提升65%,乘客等待时间压缩了半小时,实际等待时间平均只有12分钟。

“引入DeepSeek大模型之前,我们接到交通预警信息以后需要人工去比对,调取高德数据、公交数据、地铁数据等多系统数据交叉分析,至少滞后2个小时才能协调增派运力。”赵子告诉记者,“现在部署了DeepSeek大模型,我们将昌平本地交通运行数据、区应急预案、法律法规等导入系统,形成本地化的知识库,大模型就可以开展深度学习和精准分析,为管理人员提供更加智慧化的服务和精准的本地化解决方案。”

二、“百事通”助力提升服务水平

DeepSeek如何服务群众办事?昨天上午,记者来到丰台区政务服务中心探

访。

“您好,我和别人合伙办了家企业,现在想注销,应该怎么办理啊?”一位女士到总咨询台询问。工作人员张峥听后,立即“叫醒”电脑屏幕上的“丰

小政”,输入“合伙企业注销”几个字,很快,企业注销核心流程就显示出来,还列出了需要准备的关键材料清单。张峥依据提示迅速解答问题,这位女士非常满意。

办事大厅里人来人往,涉及的政务事项有1700余个,但拥有了人工智能好

助手“丰小政”以后,张峥比过去更加从容。

“DeepSeek大模型像一位刚上岗的好帮手,有能力,但缺少相关的政务知识储备。”丰台区政务服务运行保障中心副主任郭盈介绍,“因此我们在训练过程中,不断将政务事项数据‘喂’给大模型,促进它不断成长,从新成员变成‘百事通’,进而帮助工作人员提升服务水平,让每位办事群众能享受到‘百事通’带来的优质服务。”

三、探索更多应用场景

昌平区的“回天大脑”基层治理政务系统也部署应用了DeepSeek大模型,其具备精准问答与逻辑推理两大核心功能,能够为社区工作者提供高效精准的决策支持。社区工作者只需简单操作,即可获得精准的政策解读、数据分析及问题解决方案,提升了工作效率和服务质量。

在丰台区政务服务中心,DeepSeek大模型版的“丰小政”已经在“一号统领”服务热线、综合专区窗口、在线导办等点位全面开始推行。中心的政务服务咨询平台办公室,63397070“清零热线”客服专席王茹艺为DeepSeek点赞:“以往遇到拿不准的问题,需要反复翻查数据库和网站,如今只要唤醒‘丰小政’数智助手,相关事件办理流程、知识就能立即呈现,极大地提高了我们的工作效率。”

新技术融入城市管理,这并非首次,大模型之前,AI视频识别、大数据分

析、云计算、物联网等新技术都已在城市智慧管理中得到应用。

不过,人工智能等新技术也并非万能,它的准确性、稳定性仍需在长时间应用中加以验证。赵子告诉记者,政府部门工作的严谨性要求工作人员对人工智能分析结果负责,最终实际可执行的方案、发布的信息仍需人工核验。这就对工作人员的专业能力提出了更高要求,既要懂行业懂业务不断深耕,还要懂技术懂应用,紧跟科技发展步伐,与计算机协同工作,不断提升管理和服务能力。

多地“AI公务员”上岗

中国电子报记者齐旭(2025年2月28日)

近日,记者在北京市丰台区政务服务中心看到,咨询台工作人员在解答群众问题时,多了一位智能“新同事”——基于DeepSeek大模型开发的“丰小政”数智助手。当工作人员遇到“拿不准”的事项时,不用再打开数据库、相关网站搜索,直接唤醒“丰小政”提问,便能快速定位知识点,解答效率大幅提升。

DeepSeek开源模型的正式推出,推动我国政务系统智能化升级迈入新阶段。近期,全国多地积极顺应这一趋势,探索算法开发与海量场景落地的协同发展,一时间,一批“AI公务员”上岗,推动政府科学决策及社会治理精准化,为企业和群众提供更加便捷、高效、精准的政务服务。

一、推动科学决策及社会治理精准化

近日,江苏南通城市运行管理服务平台成功引入了DeepSeek-R1V3系列大模型,应用于城市管理AI场景。据介绍,此次引入的DeepSeek-R1大模型,是在原有图像AI智能识别技术基础上的重大突破,可对来自12345市民热线、视频AI案件综合管理平台和“诚e管”等渠道的城管类案件信息进行精准预处理。

“以往案件处理需要层层转派,耗时较长。现在通过DeepSeek大模型的预处理,案件信息可以直接派发到一线城管队员手中,大大缩短了处理时间,也减轻了基层人员的工作负担。”南通市城管局相关负责人介绍道。

在山东,临沂率先打响全省政务系统接入DeepSeek“第一枪”。近日,临沂市基于政务云成功实现了DeepSeek本地化全栈部署,完成“沂蒙慧眼”(企业精准画像)系统的接入应用。“沂蒙慧眼”系统在DeepSeek大模型加持下,新增了慧眼AI会话、画像报告自动生成、企业风险预警等功能,大大提高了系统数据关联分析与决策响应能力。

DeepSeek还能实现政务办公的智能化和自动化,提高工作效率。深圳福田基于DeepSeek的政务大模型,上线了11大类70名“数智员工”,覆盖公文处理、民生服务等240个场景,公文审核时间缩短90%,执法文书生成效率提升至秒级;安徽合肥完成DeepSeek-R1模型的本地化部署,上线了高新知识库、公文智能摘要等功能,同时通过本地化训练和适配调优加快推动政策问答助手、督办任务分析等功能上线。

复旦大学数字与移动治理实验室主任郑磊认为,以DeepSeek为例,其技术特性与我国数字政府建设的需求在一些方面较为契合。相较于ChatGPT,DeepSeek的成本显著降低。同时DeepSeek模型在中文场景有较好的理解和推理能力,在进一步训练后可以更准确地理解各类行政术语、政策文件和民众诉求中蕴含的语义差异,让数字政府更有温度、更接地气。

“接受AI、使用AI,而非用AI替代人工决策。”江苏江阴市城市运行管理中心相关负责人指出,“我们始终将AI定位为‘辅助工具’,核心目标是通过技术应用推动干部队伍数字化素养的整体升级,促进政府职能转变、工作提质增效。”

二、带来高效的公共服务

近日,山东济南市市中区在“市中云”上接入了DeepSeek。打开“市中云”小程序,DeepSeek小鲸鱼标志出现在显眼位置。输入了一条政务咨询信息“在济南市中区如何办理营业执照?”在经过十几秒思考后,DeepSeek给出一套办理流程,包括线上办理以及线下办理,还对特殊行业要注意的时效和需提交的文件给出了提示。

生成式AI大模型的核心功能之一,就是通过自然语言对话,快速解答用户的问题。因此,政务服务的智能问答功能提升,是各地首批快速部署的重点场景。

在山东泰安东平县,DeepSeek充当起了“政策翻译官”,破解申报盲区;在“智能文书生成”服务中,系统可自动匹配法律法规及地方政策,生成符合要求的文书材料;推出“智能审批”服务,通过输入企业申报关键信息,系统可自动审批。

前不久,广东梅州12345政务服务便民热线正式接入DeepSeek大模型,实现四大功能,即进行智能文本机器人应答、智能辅助填单、智能工单分类、智能工单转派,确保热线打得进、接得好、能转办,实现市民诉求“接得更快、分得更准、办得更实”的目标。

北京市丰台区政务和数据局相关负责人透露,上线“丰小政”后,下一步还将探索更多应用场景,如智能审批查询、政务决策、政务事项智能化办理等,进一步释放大模型的潜力。目前模型的知识储备主要基于已有政务事项数据,部分复杂或特殊场景的知识覆盖仍需完善。在高并发使用场景下,模型的响应速度和准确性仍有提升空间。

DeepSeek等大模型的应用,正在改变公众与政府部门间的交互方式。“我们网购的时候,常常会感到智能客服一点儿也不智能,还是要想尽办法去找到人工客服,才能解决问题。在办理政务服务的时候也是一样。”郑磊指出,未来人机交互的界面将不再是网站,而是对话,网页菜单再优化,也不是寻找信息的最优方式,最好的方式就是提问、回答。大模型可以更准确地把握用户的实际需求,有助于将群众的口语化表达更为准确地匹配到相应的政策与服务事项,提供更精准的服务指引,解决“群众不会问、部门答非所问”的痛点。

北京大学深圳研究院6G与人工智能课题组组长、副研究员胡国庆分析认为,在“十五五”规划期间,数字政府规划和AI大模型应用有望高度结合。通过将重复烦琐的事务交由AI,以精简AI的政务效率,会是未来发展的重要趋势。“相信会有越来越多的政府部门尝试多种路径与AI相结合。”他说道。

三、如何守住安全底线?

DeepSeek等大模型在政务领域释放应用潜力的同时,数据安全与隐私保护问题亦引发关注。“安全问题事关重大,未来在政务服务中大规模应用大模型技术,一定要严格落实数据安全‘三法一条例’,以及配套规则标准的要求。”广东数字政府研究院院长余坦说道。

北京市丰台区政务服务和数据管理局相关负责人介绍,目前模型直接部署于政务云,数据存储于本地基础设施,确保数据在政务云内部闭环流转,有效防止第三方不当获取,构筑起数据安全壁垒。下一步也将持续完善数据安全防护机制,确保模型训练和使用过程中的数据安全与合规性。

有业内专家建议,大模型在政务领域的应用可分阶段开展,即早期选择低风险场景试点,如政务服务热线、智能问答等,积累安全防护经验;中期可扩展至政策文件辅助撰写等中度风险场景,同步完善审计追溯机制;后期可探索应急指挥决策支持等高价值场景,同时部署量子加密信道等强化措施。

还需要指出的是,当前包括DeepSeek模型在内的生成式AI仍可能出现不准确或答非所问的情况,统称为“幻觉”。一旦在政务领域出现政策内容的编造,后果可能比较严重。此外,在高质量公共数据集和语料库的建设与供给上,也还存在不少体制机制方面的障碍。

“保证信息的精确程度,就需要输出的内容达到场景需求,这就要求技术团队提供综合化的端到端的解决方案。”香港生成式人工智能研发中心预研部主任韩斯睿表示,针对“AI+政务”的应用面临数据质量、隐私安全和技术适配

性挑战,需要强化数据治理与算法监管,构建安全可信的技术框架,推动“人机协同”模式落地。坚持技术为民、安全为基、制度先行,才能实现技术创新与制度保障双轮驱动,让AI成为提升治理效能的“数字助手”。

政务系统接入DeepSeek 多地数字政府建设进入深化提质阶段

上海证券报记者李雁争(2025年2月18日)

作为日常生活中与公众交互最密切、最频繁的场景之一,政务服务与人工智能大模型在信息收集、文本总结、智能交互等方面的能力高度契合。多地近日宣布,已将DeepSeek应用于政务系统,面向用户开展应用。

2月16日,深圳市基于政务云环境面向全市各区各部门正式提供DeepSeek模

型应用服务,实现了基于DeepSeek的人工智能政务应用一体化赋能升级。

广州市政务服务和数据管理局近日在政务外网正式部署上线DeepSeek-R1(671B)、DeepSeek-V3(671B)大模型。广州将通过政务专网算力推动人工智能大模型在民生政策解读系统、12345热线工单分派等政务领域的应用。

无锡市数据局2月16日在官微宣布,无锡实现了政务信创环境下DeepSeek-R1(671B)全尺寸模型部署。基于DeepSeek的智能应用矩阵正有序向全市各级各部门开放,无锡“城市大脑”城市运行管理中心将通过持续的技术迭代和服务优化,为政务人员办公和市民群众咨询办事提供更高效的辅助服务。

此外,南京、苏州、郑州、呼和浩特等地的城市算力网也陆续宣布上线

DeepSeek系列大模型,完成本地化部署上线。

北京大学深圳研究院6G与人工智能课题组组长、副研究员胡国庆表示,当前,数字政府建设已进入深化提质阶段。接下来,会有越来越多的政府部门尝试通过多种路径与AI相结合。

专家同时提出,DeepSeek在政务上的应用不应止步于“智能秘书”“智能客服”,而更应该通过海量的数据资源、强大的计算能力,对城市中各类事件进行自动发现识别、智能研判分析、分类定性,实现“算力”替代“人力”。

部分城市已经做出了表态。呼和浩特市大数据管理局近日表示,下一步,将从DeepSeek与“城市大脑”深度融合发力,利用大数据和人工智能等先进技术,通过对文本、图像、视频等多模态数据融合分析,让“城市大脑”进行“深度思考”,助力公共数据汇集治理和共享应用,不断提高城市治理现代化水平。

深圳市政务服务和数据管理局相关负责人表示,深圳市将以DeepSeek深度部署应用为新起点,以开放态度拥抱人工智能全栈技术和产品体系创新,建强数字政府智能中枢赋能人工智能建设,加速打造一批示范性强、显示度高、带

动性广、干部群众获得感强的政务领域人工智能应用场景,推动全市人工智能

产业和应用创新发展。

360集团创始人周鸿祎曾表示:“中国发展大模型的一个重要方向应该是借助产业和场景的优势,将大模型与业务流程、产品功能相结合,寻求多场景应用、垂直化和产业化的落地。”

西南财经大学经济学院教授、政治经济学研究所所长吴垠认为,政务服务是公共事业,要以最低的成本来提供最优质的服务,DeepSeek持续降低成本已达到“成本拐点”,有助于普惠AI融入公共服务。接下来,各地要以数字政府建设为支点,持续探索数字化转型的理论、机制、方法、路径,推动数字化转型的成效尽快惠及千家万户、千行百业。

多地政府接入DeepSeek智慧政务不止效率

北京商报记者金朝力

(2025年2月20日)

DeepSeek的火爆也延展到政务领域。2月19日,北京商报记者获悉,北京、广东、江苏、内蒙古、江西等多地宣布,其政务服务系统接入DeepSeek系列大模型。 此外, 三大电信运营商、 中石油、 中石化等中企巨头也纷纷宣布与DeepSeek展开合作。

有关分析认为,DeepSeek不仅在内容生成、智能交互等方面提升办公效率,还能够与政务系统深度融合,助力城市治理和公共服务升级,从而推动政府从传统管理模式向智能化、数字化管理模式的转变。

一、多地政务系统部署应用

2月19日,北京商报记者获悉,北京市丰台区政务和数据局完成了政务云本地部署DeepSeek大模型环境,将其应用于政务服务领域,上线了“丰小政”数智助手,聚焦丰台区政务服务“清零热线”和企业群众办事需求,培育数智化的业务助手和工作伙伴。

2月18日,北京昌平区政务和数据局依托华为昇腾算力平台,完成DeepSeek-V3及DeepSeek-R1全参数优化版本的上线。而“北京海淀”微信公众号在2月11日就发布消息,北京市海淀区正式为区内企业提供DeepSeek全量模型服务,为辖区内行业提供大模型开发、大模型推理API服务、大模型应用开发服务等。

不止北京,全国各地陆续宣布将Deep-Seek应用于政务系统。

2月16日,深圳市基于政务云环境面向全市各区各部门正式提供DeepSeek模型应用服务,实现了基于DeepSeek的人工智能政务应用一体化赋能升级。值得一提的是,2月8日,深圳市龙岗区政务服务和数据管理局已经在政务外网部署上线了DeepSeek-R1全尺寸模型,成为广东首个在政务信创环境下部署上线该模型的政府部门单位。

据微信公众号“中国广州发布”2月16日消息,近日,广州市政务服务和数据管理局在政务外网正式部署上线DeepSeek-R1、V3671B大模型,通过融合海量政务数据要素,大模型将丰富政务服务场景应用,推动人工智能大模型在民生政策解读系统、12345热线工单分派等政务领域应用。

此外,呼和浩特市大数据管理局组织内蒙古大数据产业发展集团技术团队,

完成了DeepSeek-R1在政务外网的本地化部署;江西赣州市已完成政务环境DeepSeek系列大模型部署,成为全省首个成功部署上线该大模型的地级市;江苏南京、苏州、无锡、常州、盐城、连云港等地的城市算力网陆续宣布上线DeepSeek系列大模型。

政府部门纷纷介入DeepSeek系列大模型,也带火了DeepSeek的相关讲座与培训。在河南省郑州市,2025年第一期全市领导干部“问学前沿”讲堂,聚焦于DeepSeek;江苏苏州市委组织部举办以“从DeepSeek看人工智能产业发展”为主题的领导干部“新技术、新产业、新模式”菜单式讲座。

二、服务模式的重大变革

从国内外企业纷纷接入DeepSeek,到多地政府官宣将其用于政务系统,DeepSeek已成为业内外名副其实的“顶流”。有关人士认为,DeepSeek应用到政务领域,不仅是技术进步的体现,更是政务服务模式的一次重大变革。

有关专家指出,DeepSeek最大的优势就是性价比高。作为一个超级智能“大脑”,它不仅聪明,而且用起来还很划算。

北京市丰台区政务和数据局相关负责人介绍:“此次接入DeepSeek大模型,是优化营商环境、推动高效办成一件事改革的积极探索。‘丰小政’作为数智化的业务助手和工作伙伴,将帮助工作人员成为‘政务服务百事通’。当工作人员接听市民热线或是接待办事人员时,如果遇到‘拿不准’的事项,不用再打开数据库、相关网站搜索,直接唤醒‘丰小政’提问,就可以得到详细的解答。”

据了解,在深圳市龙岗区,目前DeepSeek通过区智慧办公系统(OA)“龙小i”应用矩阵,为全区两万多名公职人员提供服务。

基于国产大模型,深圳市龙岗区已上线34个政务AI应用,广泛覆盖政务办公、城市治理、民意速办等核心领域,成效显著。在政务办公方面,公文写作助手能进行政策解读、文件起草和智能校对;在城市治理领域,“一句话找人找视频”功能基于多模态大模型,结合23万路视频监控,已成功帮市民找回走失人员300余次;在数据分析上,以往人工分析民意诉求热点耗时费力,现在DeepSeek能在分钟级完成分析,为决策提供有力依据。

世界院士专家联合会执行秘书长、中国民协新质生产力委员会秘书长吴高斌认为:“DeepSeek具有强大的自然语言处理能力以及高效的知识图谱构建,实现跨领域信息的快速检索与整合;同时,其灵活的智能交互界面,支持语音、

文字等多模态交互。这些特点使得DeepSeek能够快速处理大量政务信息,实现

高效的人机交互。”

三、应用场景将不断扩容

在资深人工智能专家郭涛看来,Deep-Seek用于政务系统带来的裨益远不止

于提升政务的效率。

“在多模态数据融合分析方面,DeepSeek可以整合图像、视频、文本等多种类型的数据。通过深度学习和大数据分析技术,它能从海量的多模态数据中挖掘有价值的信息, 为城市大脑提供全面、 准确的决策依据, 实现 ‘深度思考’ 。同时,通过对历史数据的学习和分析,预测未来趋势和可能的风险,帮助政府制定更具前瞻性和针对性的政策,提高决策的科学性和合理性。”郭涛进一步解释道。

而为了更好地适应DeepSeek等新技术的应用,政府也需要在多个方面进行调整和改变。中关村物联网产业联盟副秘书长袁帅表示,首先,政府需要加强数据治理,确保数据的准确性、完整性和安全性。其次,政府需要培养一支具备数据分析和技术应用能力的专业队伍,以更好地利用DeepSeek等技术提升政务效能。此外,还需要建立健全相关法规和政策体系,为新技术的应用提供法律保障和政策支持。同时,应积极推动跨部门的数据共享与协同工作,打破信息孤岛,实现政务服务的无缝衔接。

在业内看来,政务应用与人工智能结合,或将成为未来重要发展趋势,随着技术的不断成熟和完善,DeepSeek将进一步提升政务服务的智能化水平,推动政府治理体系和治理能力现代化。

据悉,北京市丰台区政务和数据局将以DeepSeek大模型部署应用为新起点,与有关业务部门携手合作,紧密结合政务服务的改革创新和企业群众的迫切需求,持续优化大模型与现有政务系统融合升级,推动政务服务向纵深场景维度、向广袤科技领域拓展和延伸,不断满足人民群众对高效、便捷政务服务的新期待。

“未来,DeepSeek在政务领域的应用场景和发展方向将更加广泛和深入。除了现有的智能客服、政策解读、数据分析等功能外,DeepSeek还有望在智能审批、城市规划、交通管理、环境保护等领域发挥重要作用,同时,DeepSeek的开源特性也将吸引更多开发者参与优化和定制,推动技术的普及和应用创新。”袁帅说。

多区政务平台接入DeepSeek

北京晚报记者孙云柯孙颖(2025年2月25日)

随着DeepSeek大模型技术火爆全球,本市多区相继开展实践探索,将智慧城市管理平台、政务服务平台等接入部署DeepSeek大模型,利用人工智能赋能城市管理、政府服务和基层社会治理。接入DeepSeek后效果如何?记者分头探访。

一、不到20分钟生成应急方案

2月22日下午3时,昌平区城市管理委城市运行监测科工作人员赵子正在值班,一条应急预警信息引起了他的注意。系统显示:乐多港东门周边人流较平日激增200%,可能引发交通拥堵。

赵子立即打开接入了DeepSeek大模型的“昌平城市运行助手”,系统结合商圈活动排期及周边实时路况,很快识别出运力运量偏差。不到20分钟,系统经过综合分析自动生成交通应急方案:下午4时至6时需在886、891路增开8班区间车,并增加昌68路40%运力驰援。赵子立即将方案推送给各相关单位及公交公司,经管理人员研判后由公交公司执行方案,通过动态发车系统增加运力。

得益于提前安排部署,乐多港游客快速疏散,周边交通运行平稳。当天实际运行数据显示,下午4时15分至5时30分高峰期公交承运效率提升65%,乘客等待时间压缩了半小时,实际等待时间平均只有12分钟。

“引入DeepSeek大模型之前,我们接到交通预警信息以后需要人工去比对,调取高德数据、公交数据、地铁数据等多系统数据交叉分析,至少滞后两个小时才能协调增派运力。”赵子告诉记者,“现在部署了Deep-Seek大模型,我们将昌平本地交通运行数据、区应急预案、法律法规等导入系统,形成本地化的知识库,大模型就可以开展深度学习和精准分析,为管理人员提供更加智慧化的服务和精准的本地化解决方案。”

二、1700余个事项智能帮办

DeepSeek如何服务群众办事?昨天上午,记者来到丰台区政务服务中心探

访。

“您好,我和别人合伙办了家企业,现在想注销,应该怎么办理?”一位女士到总咨询台询问。工作人员张峥听后,立即“叫醒”电脑屏幕上的“丰小

政”,输入“合伙企业注销”几个字。很快,企业注销核心流程就显示出来,还列出了需要准备的关键材料清单。张峥依据提示迅速解答问题,这位女士非常满意。

办事大厅里人来人往,涉及的政务事项有1700余个,但拥有了人工智能好

助手“丰小政”以后,张峥比过去更加从容。

“DeepSeek大模型像一位刚上岗的好帮手,有能力,但缺少相关的政务知识储备。”丰台区政务服务运行保障中心副主任郭盈介绍,“因此,我们在训练过程中,不断将政务事项数据‘喂’给大模型,促进它快速成长,从新成员变成‘百事通’,进而帮助工作人员提升服务水平,让每位办事群众能享受到‘百事通’带来的优质服务。”

三、拿不准的问题一唤即知

昌平区的“回天大脑”基层治理政务系统也部署应用了DeepSeek大模型,其具备精准问答与逻辑推理两大核心功能,能够为社区工作者提供高效精准的决策支持。社区工作者只需简单操作,即可获得精准的政策解读、数据分析及问题解决方案,提升了工作效率和服务质量。

在丰台区政务服务中心,DeepSeek大模型版的“丰小政”已经在“一号统领”服务热线、综合专区窗口、在线导办等点位全面开始推行。中心的政务服务咨询平台办公室,63397070“清零热线”客服专席王茹艺为Deep-Seek点赞:“以往遇到拿不准的问题,需要反复翻查数据库和网站,如今只要唤醒‘丰小政’数智助手,相关事件办理流程、知识就能立即呈现,极大地提高了我们的工作效率。”

广西多家医院接入DeepSeek

广西日报记者关海芳罗婧(2025年2月20日)

利用DeepSeek强大的知识积累体系,为医生的临床诊疗担当助手;最快2分钟内生成一份结构化病历,帮助医生从繁琐的文书工作中解放出来;投喂数据,让人工智能更快速地成长

近日,广西多家医院开始部署DeepSeek的本地化应用。

一、DeepSeek本地化应用能做啥?

DeepSeek入驻医院,会给诊疗带来哪些改变?

在自治区人民医院,该院将DeepSeek大模型与医院的信息管理系统进行了

集成,现已在耳鼻咽喉头颈科、眼科进行试点使用。

轻点鼠标,进入医院信息管理系统,点击DeepSeek,输入查询的问题,便可让人工智能成为医生的小助手。该模型能精准分析患者的海量健康数据,实现智能化临床辅助决策,为医生提供科学、精确的诊断建议,给临床诊疗带来极大便利,为患者带来更为高效的医疗服务体验。

2月19日, 广西医科大学第一附属医院泌尿外科AI医生正式发布上线, 据悉,这是国内首个依托医疗专科大语言模型技术研发、医院自有知识产权的泌尿外科AI医生。

今年,该院在原有平台基础上,以DeepSeek为基础架构,使用超过300万字的泌尿外科专业语料文库对模型进行了训练,随后,团队利用多种深度学习技术提取医生的形象和语音特征,创造了生动形象的虚拟数字医生。只要打开广西医科大学第一附属医院互联网医院的线上问诊页面,在医生主页的服务项目内,泌尿外科AI医生可7×24小时全天候响应患者的咨询需求,处理超过80%的标准化问答,为患者制定个性化的健康管理方案。

近日,南宁市第一人民医院心内科上线了基于大模型深度训练的AI数字人服务。患者通过医院官方平台预约挂号时,AI系统可通过语义分析自动识别心内科需求,快速匹配症状关键词库,智能推荐对应亚专科专家资源,分诊准确率高。心血管内科专家配备专属数字人形象,患者因此有了虚拟健康管家,该管家不仅能通过语音文字解答检查注意事项,诊后自动推送用药提醒及复诊计划,还计划打造全病程管理体系,为患者提供个性化健康管理方案,目标是实

现从单次诊疗到终身健康陪伴的服务升级。

在南宁市第二人民医院,“AI生成式病历系统”近期已在该院住院部启用,它可以依据患者各类诊疗数据,自动生成规范的入院记录、首程记录及出院记录等病历内容。

“‘AI生成式病历系统’依托AI大模型技术,能高效整合患者门诊、住院以及历史的就诊记录资料,进行深度思考和推理分析,迅速提供科学、精准的决策建议。”该院相关负责人介绍,院内住院部医生基于系统可自动生成多场景、连贯、规范病历文书的强大功能,大大缩短病历书写时间,提升工作效率。

经检测,该系统最快能在2分钟内生成一份结构化病历,帮助医生从繁琐的文书工作中解放出来,让医生有更多时间专注于临床工作,为患者提供更高质量的医疗服务。

2月17日,贵港市人民医院将DeepSeek大模型与现有的医院信息管理系统及办公平台进行了融合,启用了“贵医智能助理”。除了可快速获取患者的各类医疗数据,进行智能化分析,辅助医生在短时间内作出精准的诊断与处方建议,“贵医智能助理”系统还有医院内知识库学习、联网搜索、文件解析、PPT辅助制作等功能。

二、中医也能用DeepSeek看病吗?

在广西中医药大学第一附属医院,该院近期也完成了DeepSeek的本地化部署。“我们专门成立了一个6人的团队负责这项工作,当前是在医院信息管理系统和电子病历系统(下称医生工作站)中部署测试,将病历信息、影像信息、检验检查信息等脱敏后少量导入,让DeepSeek学习,待时机成熟后,将它接入医院的大数据中台,加快模型的成熟。”该院工程信息部主任肖易介绍。

“DeepSeek投入使用后,主要是为医生做辅助性诊断,提高诊断的效率和准确性,并实现中医特色诊疗工作的人工智能支持。”肖易说。在训练过程中,医院会给DeepSeek投喂大量脱敏的病历信息,包含专用术语、病情描述、医生诊断、图片资料、放射资料、病理资料、检查检验资料等,让DeepSeek通过学习尝试诊断病人病情,为医生给患者看病作辅助诊断。

以胃癌为例,医院会将胃癌病人的所有影像资料、检验检查结果等定向导入人工智能系统,让机器学习。之后,当医院输入胃癌患者相关的一些症状信息时,机器就会根据此前的学习,判断患者癌细胞分布区域、恶性程度、中医证型等,通过以往的成功治疗经验,给出最适合患者的治疗方案供医生参考。

“数据越规范、量越大,诊断就越精准,所以我们会批量导入脱敏数据,加快AI的学习进度。”肖易说。目前该模型计划在放射科、外科、中医治未病中心部署。下一步,如果模型升级到更大的版本,医院将利用大数据生态一体化中台,将医院的所有数据导入,把机器“喂饱”,让它能更好地分门别类学习,将DeepSeek应用到更多医疗场景。而该项工作的部署,会贯穿该院整个“十五五”规划。

三、未来之路如何走?

在采访中,记者了解到,目前各医院的部署仍处于初始阶段,人工智能赋

能医疗发展,还有很长的路要走。

首先医疗机构的人工智能本地化部署涉及技术问题,并不像个人下载DeepSeek就能满足使用需求那么简单。肖易介绍,实现本地化部署,首先是探索版本的速度、运算逻辑等,再根据开设的场景进行相关硬件配置,需要采购专业的、大容量的硬件设备来满足DeepSeek最大版本的部署,才能投入使用。在使用的过程中,还需要对使用场景做大量针对性训练等。

随着人工智能的发展,对复合型人才也提出了更高要求。肖易认为,未来5 —10年,人工智能在医疗场景的运用会迎来快速发展时期,既懂医疗又懂信息的人才会更受欢迎,这对医疗人才的培养也提出了新要求。

“下一步,医院还会在技术方面不断进行优化和完善。”自治区人民医院信息网络管理中心主任李虎介绍,医院会结合临床医疗业务实际应用场景及需要,探索对DeepSeek大模型进行进一步本地化训练,提升DeepSeek专业化服务能力,更好地服务临床。

“每个医生都有自己的经验和诊疗策略,可以为每一个医生去训练属于自己的大模型。”自治区人民医院眼科主任徐帆认为,未来可以把医生多年的病例数据、手术设计等信息输入大模型,让人工智能“变身”成医生的专属助手。在采访中,记者发现,群众对人工智能+医疗的运用也需要一个接受的过程。

2月18日,在自治区人民医院就诊的患者王先生表示,他自己也经常使用DeepSeek查询一些健康科普问题,他认为医疗机构部署该模型的本地化应用是大势所趋。而另一些年纪较大的患者则表示,不太懂人工智能,看病更倾向线下找医生。

无论怎样,人工智能时代,未来已来。李虎认为,人工智能将会在医疗服务管理、医药服务、医保服务、后勤管理、科研教学等领域得到进一步推广应

用,潜力巨大,对医疗服务的提供方式、诊断的准确性、治疗的有效性以及医院的综合管理会带来深刻的改变。

惠州12345热线引入DeepSeek

惠州日报记者游璇钰(2025年2月18日)

近日,惠州市政务服务和数据管理局积极探索DeepSeek先进技术本地化应用,开展本地语料知识库搭建、场景挖掘等。目前,该局已成立“DS+惠民速办”场景应用专班,并于2月12日完成DeepSeek在政务云模型的本地化部署,将AI技术率先与12345热线融合创新。

“通过AI技术赋能民生诉求响应,将助力12345在数字化智能化转型中占据先机,探索从‘民意感知’到‘服务提质’的智能化升级。”该局有关负责人表示,通过AI赋能,将为惠州政务热线数字化转型提供创新范本,也将为市民提供更高效、精准的政务服务体验。

一、全链条应用AI,推动效率质量双提升

作为市民与政府沟通的桥梁,惠州12345热线年均受理诉求超200万件。面对庞大的服务需求,传统人工处理模式面临效率与精准度的双重挑战。为此,市政务服务和数据管理局引入DeepSeek大模型技术,构建覆盖“智能知识库—智能应答—智能辅助分拨—智能跟进”的全链条AI赋能体系。

例如,在智能知识库上传政策文件后,DeepSeek可以自动解析条款并构建关联知识图谱,话务员通过自然对话提问即可秒级获取精准答案,有效提升知识条目调用效率。

智能应答则是通过实时语义分析精准理解市民诉求,自动匹配知识库中的政策依据与解决方案,为话务员提供动态应答建议,辅助话务员快速响应复杂咨询。在实时通话的过程中,智能辅助分拨将通过提取通话中时间、地点、事件类别、诉求详情等关键要素,自动填充至标准化工单模板,提高书写效率,大幅压缩人工的补录率,确保工单信息完整性与准确性。

通话结束后,DeepSeek自动生成结构化摘要,包括问题描述、处理建议、关键时间节点等,话务员可一键导出并同步至回访系统,使市民诉求得到有效跟进与回访。

二、驱动政务服务从“被动响应”转向“主动治理”

值得一提的是,AI驱动下的“未诉先办”模式,可以通过舆情分析预判热点问题,主动介入解决隐患,推动政务服务从“被动响应”转向“主动治理”。

在此过程中,基于DeepSeek自然语言处理技术,系统将自动为工单标注领域标签、场景标签,生成热点问题趋势报告。通过这种方式,将提升诉求分类效率和数据分析精准度,辅助政府部门优化资源配置,助力科学决策。同时,DeepSeek对高频诉求进行实时聚类分析,自动识别集中性、群体性事件,触发舆情预警并推送至承办部门,助力政府提前介入处置。

“引入DeepSeek不是代替人工, 而是深化 ‘人机协同’ 服务。 ” 惠州市12345热线负责人介绍,AI技术解决的是标准化问题,释放出来的人力资源更加专注于解决个性化难题,大模型技术实现服务资源的最优配置,实现“速度”与“温度”的完美结合。

据透露,接下来,市政务服务和数据管理局将在“DeepSeek+政务热线”的探索基础上,开展“DeepSeek+政务应用”的深度探索,通过Deepseek与政务OA结合,提升政府机关行政办公效率;Deepseek与政务服务平台结合,提升政务服务智能化、精准化水平等,推动DeepSeek技术与“一网统管”“跨部门协同”等场景深度融合,探索打造“泛在可及、智慧精准、公平普惠”的政务服务生态体系,为政务服务数字化转型贡献“惠州方案”。

普通人怎样当好AI玩家?

济南日记者曹雅欣

(2025年2月17日)

最近最火的AI模型非DeepSeek莫属。有人说它“有人味儿”,有人“深夜被它治愈”,有人感慨“离失业又近了一步”。在社交平台上搜索DeepSeek,能看到网友们用它写诗、炒股、写作业,还能学习恋爱话术、获得改变外观形象的建议这届年轻人把DeepSeek玩出了花儿。

作为一款开源、免费的大模型,尽管它自身还未实现盈利,但第一批用它“搞钱”的人已经出现了。同时,AI在电影、电视等行业深度应用,也再次让人们思考AI的价值和普通人应有的应对。

一、“人味儿”成了关键词有人把它当“树洞”记者他们都说你有“人味儿”,你觉得呢?

DeepSeek哈哈,这么说挺有趣的!我很感激大家这么说。我致力于以真诚

和开放的态度与大家交流,希望能给大家带来温暖和帮助。

说起DeepSeek与以往的AI对话工具最大的不同,很多人的第一直觉都是它

似乎更“通人性”、有“人味儿”。

面对网友的提问,DeepSeek的回答往往不仅是一份冷冰冰的方案,更伴随着精神上的认可和鼓励。

有网友问:“找不到工作,没有存款,我该怎么办?”DeepSeek的回答让很多人感到贴心——给出“保障基本生存需求、做好紧急财务支持、争取社会支持与心理调节”这些策略之后,它出人意料地说了这么一段话:“记住,最黑暗的阶段往往是最接近突破的时刻,每一个行动都在增加你的破局概率。”

“好感人的一句话”“有被鼓励到”网友们纷纷表示从这个回答里感受到了温暖。这种与“人”对话的实感,让很多人把它当成朋友一样去询问建议,甚至把它当成“树洞”倾诉烦恼,或是让它成为自己的“恋爱军师”。

有网友把自己的多维度数据毫无保留地提供给DeepSeek系统,期望DeepSeek能够扮演一名精通心理学和神经生物学的婚恋专家,从而为自己寻找伴侣提供专业的建议。对此,DeepSeek不但很快给出了结果,还为网友列出了一些形象管理要点,并且建议将他的“人设”定位为“半导体工程师里面最会讲历史的羽毛球手”,以此打造差异化亮点,提高配对成功率。

尽管伴随着争议,但我们还是看到关于DeepSeek的话题不断冲上热搜:用

DeepSeek写寒假作业、炒股、买彩票它的出现,似乎让AI工具更加“全能”。

二、成为最热“搞钱”工具有人一个星期赚10万元记者有人利用你卖教程赚钱,你怎么看?

DeepSeek这其实是一个挺有趣的现象。知识的传播本身是件好事,尤其是当它能够帮助人们提升技能或开阔视野时。当然,这里也存在一些潜在的问题,比如内容的准确性、版权与道德问题等。

DeepSeek的火爆出圈,让许多人看到了其中蕴藏的巨大商业潜力。一时间,

各种围绕DeepSeek的赚钱门道如雨后春笋般涌现。

记者在淘宝、拼多多等电商平台搜索DeepSeek的关键词,默认展示的便是有关DeepSeek的本地部署教程、从入门到精通的学习视频,价格多在几毛到十几元之间。一位电商平台的商家曾透露,借着这波热度在淘宝中开一家卖DeepSeek的教程店铺,销量破千很容易,只要不断地起号、卖教程就行,教程是从别人那里买的,成本很低,关键是买的教程没有限制,所以可以重复卖,身边有的人一个星期就赚了10多万元。 比如, 朋友圈刷屏的清华大学 《DeepSeek:从入门到精通》报告,不少博主当成自己的成果宣传,付费在个人账号上售卖。

清华大学新闻与传播学院和人工智能学院双聘教授沈阳在接受媒体采访时表示,当前大模型已展现出类博士生的知识处理能力,这迫使普通人必须转型为“AI指挥官”:既要具备调动AI工作的能力,又要具备鉴别能力,不迷信AI生成的内容。“普通人产生AI焦虑是一种正常的心理反应,也是对于无法掌控未来变化的本能求生反应。”沈阳强调,知识付费热潮正是这种认知焦虑的货币化投射。但需要警惕的是,目前市场上包括DeepSeek在内的AI培训课程鱼龙混杂,消费者需要仔细甄别。

在沈阳教授看来,一些课程利用了人性的贪婪,即想通过某种事物快速收获、快速赚钱的心理;也利用人性的焦虑,大量炮制不学习AI就会错过机会、被社会淘汰等信息,从而成功完成私域引流与获利。

三、火爆的不止语言模型AI应用不断跨界

记者AI应用超乎想象,包括在电影界、播音界,你怎么看?

DeepSeekAI用于特效制作、角色生成、剧本分析、虚拟主播等方面已经广泛普及,但也需要我们谨慎对待,确保AI能够为人类创造更多价值,而不是取代人类的创造力和情感表达。

与DeepSeek同时在这个春节档让无数人震撼的,还有电影《哪吒之魔童闹

海》。截至目前,这部电影的总票房(含点映及预售)已突破100亿元。

“当我知道电影里很多特效离不开AI,简直太震撼了!”市民戚女士说,让自己印象深刻的“名场面”有东海龙宫百万水族逼宫陈塘关、哪吒三头六臂法相觉醒瞬间,更绝的是敖丙冰封千里特效,寒气几乎穿透银幕冰冻自己手里的奶茶。戚女士说,现在随着技术的发展,普通人上传一段视频后,再选择喜欢的影视人物,就可以一键生成视频内容,一些短视频平台的AI特效更是方便好用。

AI的新突破不止于此。记者了解到,春节期间杭州文化广播电视集团的《杭州新闻联播》节目,创新使用AI数字人进行新闻播报,且做到了零失误率,成为全国首档全数字人主持播报的联播类新闻节目。2024年3月全国两会期间,央视财经新媒体就曾打造出以总台主持人孟湛东、郭若天为原型进行复刻的AI主播——小东、小天;2024年7月,央视综合频道播出的国家级盛典《2024中国

•  Al盛典》节目上首次亮相了三名AI数字人代表——小小尼、小凡、冰冰“播音专业学生碎了”“有了数字主播,真人主持还有班上吗”从DeepSeek到数字主播,人们惊喜的同时似乎也加深了焦虑。

四、怎样用好AI工具DeepSeek有答案

记者普通人怎么用好AI,成为自己的得力帮手?

DeepSeekAI确实可以成为普通人的得力助手,比如管理你的日程、整理任务清单,并根据优先级提醒你该做什么,而且无论是写邮件、文章还是报告,AI都可以帮你生成初稿、润色语言。

“我一般用AI工具查找资料,比用搜索引擎查到的更加全面。”

“我用AI写过汇报材料,而且现在很多AI工具都有润色功能,相比几年前

的写作质量更高了。”

“我很爱玩各种AI特效,点点屏幕就能穿越到不同的场景。”

对于AI在日常生活中的使用场景,采访对象有不同的答案。从事软件开发的杨先生告诉记者,自己所在的行业因为DeepSeek的出现受到了震动,公司也收到了一些客户的反馈,希望接入DeepSeek做一些新的尝试。“对于我自己的工作而言, 这类AI工具也是有帮助的, 它的反应速度肯定比人脑要快、 要全面。 ”杨先生说,像是开发一些简单的功能模块,AI就能搞定,但是复杂的算法还需要AI生成后人工进行完善。

“AI工具给人们生活带来的改变肯定很大,但在我们业内人士看来,它对比以前的AI大模型是差不多的,可能在价格方面更亲民、话术上更加人性化。”软件工程师解先生告诉记者,他认为大众对于这类工具的了解并不深入,所以容易被网上一些所谓的“本地部署”“抓住风口赚钱”所吸引,“我觉得普通人把它当成一个好用的工具就可以了,不要神话AI,这样,卖课、卖教程的乱象也会少一些。”

对于普通人如何用好AI工具,DeepSeek也给了自己的答案——“AI就像一把双刃剑,用好了可以事半功倍,用不好反而会限制我们的思维和能力。AI工具的优势在于强大的数据处理和信息整合能力,可以帮助我们快速完成重复性工作、获取信息和激发灵感。然而,过度依赖AI工具也可能带来一系列问题。例如,过度依赖翻译软件会阻碍语言学习,过度依赖AI写作工具会限制独立思考能力,过度依赖社交媒体算法推荐会陷入信息茧房。”

千行百业为何纷纷接入DeepSeek?

南方日报记者钟哲吴雅楠吴少敏

(2025年2月20)

2月17日,一场座谈会,备受瞩目。

在民营企业座谈会现场,任正非、王传福、雷军、马化腾、马云等知名企业家坐在第一排。同坐这一排的,还有两位年轻人:DeepSeek创始人梁文锋,宇树科技创始人王兴兴。

年轻企业家“上座”的背后,是一场席卷全球的人工智能(AI)技术革命。这几天,首批70名“AI数智人”在深圳上岗;华为、OPPO、车企、学校、

医院,甚至腾讯、百度等“互联网巨头”纷纷接入DeepSeek。

这场革命,就像水、电和空气一样,正连接千行百业,深刻影响每个人的生活。那么,什么是“接入”?正在带来怎样的影响?

一、接入,“朋友圈”扩大到千行百业

点开微信搜索框,打开百度搜索页面,都可以发现,新增了一个抢眼的“AI搜索”图标。轻轻点击这个图标,就能跳转到DeepSeek,开启“深度思考”服务。

接入AI大模型,从互联网到制造业,从政府部门到学校医院,迅速形成了一股热潮——“AI数智人”开始上岗,北京、广州、深圳、东莞、佛山、南京、苏州等地政务系统,陆续接入DeepSeek大模型,并实现落地应用;

“AI辅助驾驶”正在路上,比亚迪、长安、东风等多家车企也纷纷接入,用于提升自动驾驶、智能座舱、车联网的智能化水平;

“AI医生”即将出诊,复旦大学附属华山医院、湖南省人民医院和南方医

科大学第五附属医院等三甲医院同样接入,构建“知识大脑”;

“AI教师”走上讲台,浙江大学、深圳大学上线专题课程,武汉大学完成

大模型部署,广东医科大学则联手华为为师生提供个性化教学方案的AI服务

千行百业都在接入AI大模型。令人好奇的是,到底什么是“接入”?“接入”意味着什么?“接入AI大模型,是指将大模型能力整合到自己的业务系统或产品中,从而赋能企业发展。”

德生科技公司人工智能研究院院长付玟介绍,接入DeepSeek之前,企业也接入多个大模型,并根据业务需求选择性调用不同模型的优势和特长。

需求不同,接入方式也不尽相同。

有的选择将大模型本地化部署在自有服务器或者私有云上,这样,可以实

现数据私有,关键信息不会外泄。

有的选择直接调用大模型提供的接口,像从水龙头里取水一样获取AI服务。

有一种说法,人类活动积累下来的大数据,就像前内燃机时代的石油,价

值远未被激活。如今,AI正在成为“数据石油”的“内燃机”,迸发澎湃动力。

“‘喂’进去的数据,都会变成AI‘生长’的营养。”中国工程院院士、中医证候全国重点实验室主任、中医药广东省实验室主任刘良认为,DeepSeek强大的推理能力适用于中医智能辅助诊疗系统,接入后可以快速且精准地辅助医生诊断,缓解基层中医人才短缺问题。

“工业设备的传感器和生产线日志产生的海量数据,长期未被挖掘。”巨深智能科技董事长、科大讯飞前高级副总裁杜兰认为,接入DeepSeek后,AI能充分消化这些数据,进而优化工艺参数,提高生产效率。

她举例,传统制造业正面临人力成本攀升、工艺复杂度增加,但通过AI“加持”,头部企业可以提升工艺,构建技术护城河;中小企业则能快速响应订单波动,缩短新品研发周期。

需求在增加,“朋友圈”在扩大,可以肯定,接入者也会越来越多。

二、路径,人人用得起开源大模型

今年春节假期,凭借优秀逻辑推演能力、高性价比和开源特性,国产AI大

模型DeepSeek走红全球,重塑行业格局。

一直以来,人工智能被认为是新一轮科技革命和产业变革的核心驱动力,未来30至50年将成为推动人类历史进步的最大动力。世界各国纷纷抢滩布局,但在过去,人工智能缺乏广泛应用和接入的场景。

千行百业连接AI大模型,关键突破点在于技术路径迭代升级。

早在2022年底,ChatGPT一出现,就惊艳了全球,也引起了国内学界深入思考。为什么AlphaGo、ChatGPT没有在中国诞生?为什么中国只能出现“百模大战”?

过去两年多来,以ChatGPT为代表的闭源大模型,被认为是唯一正确的发展路径。跟随这一路径,文心一言等国内大模型“群雄并起”,形成一定声势的“百模大战”,但在应用场景方面却有一定缺陷,没能与千行百业广泛连接。

开源大模型DeepSeek一出现,又一次惊艳了全球。在众多大模型中,

DeepSeek不仅在自然语言处理、代码生成、逻辑推理等多个关键领域表现出色,

而且还具备开源、低价的优势,尤其受到企业欢迎。

更为可喜的是,华为昇腾等国产AI芯片将支持或适配DeepSeek模型,持续重塑生态。这被广泛寄予厚望,有技术人员认为:“推动国产芯片与AI模型的深度融合,将有助于提升国产芯片的市场竞争力。”

开源大模型,正在成为普惠的、人人可以用得起的工具。

“有了它,我们生产的‘文旅行业数字人’不仅能为用户提供旅行方案结

果,还会阐述规划依据和思路。”付玟说。

开源大模型,燃起烽火,越烧越旺。

即便曾断言“开源大模型会越来越落后”的百度创始人、董事长兼首席执行官李彦宏,也一反之前的观点。近期,百度宣布“文心一言”将逐步免费、开源。

OpenAI首席执行官萨姆•  奥特曼也罕见表态:OpenAI在开源方面“一直站在历史的错误一边”。

“Grok的目标是理解宇宙。”北京时间18日,马斯克直播发布最新聊天机器人Grok3。他曾称赞这一机器人“聪明得可怕”,是地球上最聪明的人工智能。

三、高地,广东发展人工智能正当时

蛇年首个工作日,广东高质量发展大会上,聚光灯投向3家科技企业:华为、宇树科技与DeepSeek。

扎根广东的科技巨头华为,与来自杭州的“新势力”DeepSeek和宇树科技,

形成一场“跨城对话”。

从大环境来看,互联网时代的创业基因,让杭州成为AI创新的沃土。在这里,“杭州六小龙”孵化成长,月之暗面、百川智能等企业构建起完整的创新生态链。

从人才来看,浙江大学每年向本地“大厂”输送数千名计算机专业毕业生,形成“高校—企业”人才闭环。有数据显示,杭州人工智能人才储备已超上海、深圳总和。通用人工智能时代,呼啸而至。

人工智能与机器人产业是极具先导性、战略性、颠覆性的产业。对于始终

坚持实体经济为本、制造业当家的广东来说,是全新的机遇——

从科技创新来看,广东创新氛围浓厚,相继出台“打造通用人工智能算力生态”等22条意见和“人工智能45条”,推动科技与产业深度融合。

从产业基础来看,广东产业体系完善,拥有制造业全部31个国民经济大类,

其中15个规模位居全国第一。

从人才储备来看,广东着力培育高水平人工智能人才队伍,有28所院校开设人工智能本科专业,建设人工智能相关领域博士学位点14个、硕士学位点34个。集“天时地利人和”,广东大力发展人工智能正当时。

2月18日,广东省委书记黄坤明主持召开人工智能与机器人产业发展座谈会,就进一步推动我省人工智能与机器人产业高质量发展,听取相关行业领域科学家、企业家的意见建议。

近期,省长王伟中在广州、深圳两地进行专题调研,到重大科创平台、科技创新企业、新型研发机构,聚焦人工智能、机器人等领域攻坚突破,加快培育壮大新兴产业未来产业。

一场座谈会,两次专题调研,都密集释放信号——主动担当作为,加力发力、加快布局人工智能与机器人产业,同兄弟省份一道,共同服务我国在战略必争领域抢占先机、构筑优势。

具体到广东,要汇聚最优资源、集聚最大力量,加快打造人工智能与机器人产业高地;要深入实施“人工智能+”“机器人+”行动,不断拓展应用场景,加快赋能千行百业。

亲测12345热线:DeepSeek赋能,体验高效升级

乌鲁木齐晚报记者王媛媛(2025年2月27日)

群众的小事,“12345”的大事。

“有问题,打12345!”这句话在很多人心中,已成为寻求帮助的第一选择。今年,乌鲁木齐市大力推行“19365”集成政务服务改革,在推进“一线应

答”领域重点依托人工智能等数字化、智能化新技术,持续赋能12345热线,不

断提升热线服务质效。

乌鲁木齐市12345政务服务热线中心于2月在原有智能化系统基础上,引入DeepSeek人工智能技术,并进行本地化部署,利用DeepSeek推理大模型,升级知识库功能并强化服务精准度,为市民提供更高效、更贴心的政务服务。

2月26日,本报全媒体记者来到市12345政务服务热线中心,看看引入

DeepSeek人工智能技术后带来哪些变化。

一、秒懂政策不再雾里看花

“你好,我想问一下新生儿参保流程是什么?”市民陈先生咨询电话刚接入,市12345政务服务热线中心话务员潘欢在系统对话框里输入问题后,1秒钟便出现“社区登记—扫码上传—三天审核”三步操作图。

“以前我们也有知识库,输入内容后,可能会出现十几条相关政策文件,有的时候给市民讲解,复杂的文件条款和专业术语常常让人一头雾水,现在更清晰明了。”潘欢说,引入DeepSeek人工智能技术后,智能系统迅速给出了清晰简洁的解答,还把办理步骤、所需材料、办理地点等关键信息一一罗列,如同量身定制的办事指南。以往复杂的政策解读,现在通过智能知识库“秒变明白纸”,极大提升了咨询效率。

对此陈先生也深有感触:“我很多事情都会打12345热线求助,有时候问题

比较复杂, 话务员讲了半天还是听不懂, 就重复问, 今天这次回答就特别简单。 ”

记者试着在系统对话框输入乌鲁木齐市女职工延迟退休,系统先弹出了长达五六百字的推理过程,最后给出的回答是:乌鲁木齐市对女职工延迟退休政策规定,在达到最低缴费年限的情况下,女职工可以选择弹性提前退休,最长提前不超过3年。具体政策可能因年份和相关规定而有所不同,建议咨询当地劳动保障部门或查阅最新政策文件。

同样是按照以前没有升级的系统输入乌鲁木齐市女职工延迟退休,系统显

示出十余条相关政策。

目前,12345政务服务热线中心有90名话务员,借助知识库的智能解析,话务员日均处理量从60件增加到了85件,一次性即时解答率也有了提升。同时服务差错率环比下降了5%,群众满意率达到96.5%,比上线前提升了1.8个百分点。

二、智能派单精准解决问题

群众的“小诉求”反映着“大民生”,快速及时地为群众排忧解难,也是

12345政务服务热线的使命和意义所在。

“如果搭了一辆出租车,出现绕路情况,打12345能多久解决?”“车辆违章停车,打了电话,等职能部门过来处理,车也已经走了”也有居民提出,很多诉求都需要12345政务服务热线快速高效响应。

乌鲁木齐市12345政务服务热线中心运行服务管理科负责人王飞燕说,面对市民反映的“违章停车”“出租车拒载”等诉求,智能化系统通过升级后,自动关联责任部门并精准分派工单。

同时,为了解决政策解答不完整、工单重复派遣等问题,智能化系统升级后完善全量数据质检功能。记者看到,当话务员处理“老旧小区加装电梯”咨询时,系统即时推送几个相似典型案例辅助应答,确保服务质量持续优化。

“回答问题更加高效,这样接听率也高了。”话务员邹晓楠说。

“一条热线听诉求”“一张派单管到底”。目前12345政务服务热线建立了涵盖市属各部门单位、区(县)以及社会公共服务企业等78家协同单位热线诉求办理体系,实现“受理、转办、承办、督办、办结、回访、评价”的闭环运行工作机制。

据了解,12345政务服务热线2月份的自助派单成功率从之前的90%上升到

98%。

三、提前预警“接诉即办”迈向“未诉先办”

12345政务服务热线作为创新社会治理、为群众提供综合服务的关键平台,也是倾听民声、洞察民情、化解民忧的重要渠道。在不久的将来,随着DeepSeek人工智能的深入应用,对于居民反映的“急难愁盼”问题,提前预警将不再是难题。

未来,系统会深入分析过往数据,精准预知哪些民生问题可能出现,进而实现对民生热点的前瞻性预警。比如,在寒潮来临前,系统将主动向各区县推

送投诉集中的小区名称,并积极协调供热企业开展上门检修服务;大风天气来

临前,系统会自动分配广告牌巡查任务,有效预防潜在风险。

智能系统将依据历史数据,并结合升级后的智能化推理能力,对通话高峰进行预测。例如,在冬季供暖政策调整期间,系统将自动增加20%的座席排班,以确保供热类诉求及时得到处理。当市民反映“商户噪音扰民”问题时,系统将自动生成一份包含《市容管理条例》相关条款及处理时限的标准工单。

乌鲁木齐市12345政务服务热线中心副主任郝君说,乌鲁木齐市12345热线将依托人工智能和大数据分析技术,深化服务场景智能化应用,实现群众诉求精准派单、智能回访和风险预警的全链条升级。让热线服务成为城市治理现代化的温度计和传感器,全力打造政务热线服务新标杆。

全国首创!广州公共资源交易平台全面接入DeepSeek

南方日报记者刘珊

(2025年2月28日)

记者从广州交易集团获悉,该集团近日宣布在公共资源要素交易领域率先全面部署业界领先的智能大模型DeepSeek,初期实现深度应用于招标文件合规检测、一网通办、智能客服、智能知识库及“广数通”大数据分析平台五大核心场景,标志着公共资源要素交易行业正式迈入大模型驱动的“智能化2.0时代”,为全国同行业数智化升级树立全新标杆。

“此次DeepSeek大模型的全面启用,是集团落实‘走在前列’总要求和高质量发展的创新答卷。”广州交易集团党委书记、董事长葛群表示,“未来,我们将持续深化AI与交易服务的融合创新,加速基础交易模型的精调和典型场景的验证测试,计划年内实现政府采购、工程建设招投标等核心业务的智能化升级,为广州培育新质生产力、增强全球资源要素配置能力、助力全国统一大市场建设贡献‘智慧交易’力量。”

一、技术突破,从“流程优化”到“认知智能”的跨越式升级

“广交易”数字交易平台体系通过与DeepSeek大模型的深度融合,在智能化应用方面突破了传统业务系统依赖规则库的局限性,依托千亿级参数、国产开源大模型的深度逻辑推理与语义理解能力,实现了三大革新:

招标文件合规检测效率大幅提升:通过智能解析政策法律法规、监管负面清单及项目历史数据,自动识别招标文件中可能存在的排他性或不公平竞争条款,已完成1362个招标文件自动合规检测,准确率达到95%以上,有效减少了人工审核时间和自由裁量空间,提高了审核效率和公正性。

“一网通办”服务体验全面升级:围绕要素交易“一网通办”总目标,打造“1+4+N”的综合服务体系,在实现业务门户网站、业务工作台、身份认证、数字证书及电子签章、智能消息平台“五统一”基础上,支持自然语言交互的智能导办和搜索,可实时解答用户复杂咨询,业务办理时长可平均可缩减40%。

“广数通”赋能产业决策:借助AI数据洞察分析能力和动态知识图谱引擎,“广数通”公共资源要素交易大数据平台初步形成了强大的多源数据融合分析能力,具备宏观微观结合、全景全量分析、精准智能监管、管理服务一体等特点,能够为政府部门提供市场发展趋势和地区投资热度分析,为业务人员提供

快速的主体画像并一键生成市场趋势报告,为交易主体提供精确的信息服务和

智能问数支持。

二、服务大局,以新质生产力助推“12218”现代化产业体系建设

今年,广州高质量发展大会明确提出,加快建设“12218”现代化产业体系,推动制造业、服务业“两业融合”,数智化、绿色化“两化转型”。作为广州建设现代化产业体系的重要支撑平台,“广交易”平台紧密围绕“广州所需、集团所能”的工作要求,通过DeepSeek的深度应用,率先构建“AI+要素交易”创新链,延伸“AI+产业赋能”服务链,大幅提升交易服务质效。

通过“数据要素×产业”创新模式,推动“数据+算法+产业”深度融合,加速赋能千行百业。广州数据交易所已完成DeepSeek私有化部署,率先实现数据产权登记服务平台的全面接入,重塑数据产权登记全流程,实现效率跃升、风险可控、价值倍增三重突破,为数据产权登记提供示范性解决方案。

在智能知识库建设中,“广交易”平台整合行业数据,强化多维数据治理,深挖海量数据价值,加速工程建设、政府采购、产权交易等高质量知识库建设,赋能交易全过程中智能风控与智慧监管,助力要素资源高效配置。

智能客服系统 “广小易” 依托大模型多轮对话能力, 融合自主研发的RAG (检索增强生成)框架和知识引擎,提供贴心、智能的问答咨询服务,咨询处理质效全面提升,助力广州营商环境再优化。

三、行业领跑,打造全国公共资源要素交易AI转型“广州示范”

广州交易集团以全面实施数字化能力提升为抓手,加速推进“场地智能化、服务标准化、系统数智化”,坚定推进AI优先战略,持续提升平台智能化水平。此次创新实践,不仅加速了DeepSeek大模型在公共资源要素交易全场景应用的进程,更初步探索出四项可复制的经验:

技术融合标准:基于集团28年来积累的业务标准化成果和高质量数据集,构建“e招智胜”智慧交易大模型,打造国内领先的公共资源要素交易垂类大模型。采用大模型支撑平台、智能体开发平台、数智应用三层技术架构,实现要素交易智能体规模化、工程化开发应用,为行业提供建设指南。

数智迭代赋能:集团持续推进交易平台软硬件设施的数字化升级改造,优化交易场所空间布局,建设部署11000+智能终端设备,实施15个数字化标杆项目“组合拳”,全力构建“1+3+N”的公共资源要素交易平台可持续发展体系,在扎实完成数字化“深蹲”基础上,通过将DeepSeek大模型深度植入既有的智

能硬件集群与数字交易系统,实现智能化“起跳”。

安全可控体系:创新构建“数据隔离+内容审核+动态评估”三级风控机制,确保AI应用合规可靠。通过严格的数据脱敏和隔离技术,保护隐私数据不被泄露,增强数据安全性。引入先进的内容审核系统,自动检测并过滤不良信息,确保生成的内容健康合规。采用动态评估机制,对AI应用进行实时监控与评估,保障系统的稳定运行和持续优化。

生态共建路径:联合多家头部科技企业探索构建“智慧交易创新联合体”,促进产学研用深度融合,推动技术研发、场景孵化与人才培育一体化发展。

让DeepSeek替代公务员能给群众倒一杯热茶吗

解放日报记者巩持平(2025年2月26日)

2月19日,江苏镇江举行新闻发布会,正式宣布国产大模型DeepSeek在镇江

进行本地化部署。

镇江市数据局党组书记、局长周飞在会上表示:“镇江已经建成600台国产算力服务器集群,

单日数据处理能力相当于全市公务员10年的工作量,总体提升了数据处理的效率。”其中,关于DeepSeek数据处理能力与公务员工作量的比较描述,引发了一些争议。

人们的吐槽或不满,大多针对的是将“单日数据处理能力”与“全市公务员10年工作量”等同,在突出大模型能力的同时,是否弱化了公务员的贡献和付出?

争议的背后,实则反映的是一种社会情绪,传达的是人们对大模型的怀疑态度与警惕心理。怀疑态度,从实际体验中而来,DeepSeek虽已在多个城市实现本地化部署,但当下应用场景仍屈指可数。

当把大模型运用到日常生活中和具体工作中,威力有些释放不出来。尝试者不少,但在几番摸索后,却发现“不好用”“不会用”。

政务服务的语境中也是如此,DeepSeek实现本地部署,这才是第一步。后续具体应用还在探索,有待拓展。在有的城市,宣布大模型接入政务服务系统后,一些市民迫不及待想要体验,场景却只有政府网站上的“智能”问答助手,或者企业服务平台上的惠企政策“智能”咨询,市民不免感到失望,只能将其作为搜索引擎使用。如此一来,大模型的能力在人们的实际感受中大打折扣。

同时,若将大模型训练成为政府“发言人”的角色,准确、严谨地表达政策内容,实现本地部署远远不够,还要建立本地数据库、语料库、信息库,对其进行大量优化训练。以人才政策为例,镇江有别于周边地市,镇江当地区县之间的政策也有差异。这并非一朝一夕的工作,而当下体验的市民,自然会对大模型的实用程度产生怀疑。

从技术层面来讲,在DeepSeek的数据处理能力与人们的实际使用感受之间,目前仍隔着一条鸿沟,需要专业技术力量持续投入,才有可能搭桥修路,让普

通人也能“玩转”大模型,体验到大模型强大数据处理能力带来的方便快捷。

警惕心理,一定程度上,也是担忧与不安。人类会被AI取代吗?近段时间,这成为社交平台上最为热门的话题之一。而被替代的可能性,使得人们不得不对大模型等AI工具充满警惕。

镇江并非第一个在本地部署DeepSeek的城市。前几天,深圳福田区70名“AI公务员”正式“上岗”。在长三角,南京、苏州、无锡、常州、绍兴、合肥、黄山等多地也已“官宣”政务服务系统接入DeepSeek。

一些地方组织领导干部专题学习,明确提出要引入AI辅助领导干部决策,要求公职人员手机至少安装两个人工智能软件,必须会使用DeepSeek。苏州、宁波等地也在开展讲座,组织干部学习人工智能等前沿技术。

公共服务部门主动拥抱新技术的热情和速度让大家充满期待,不过也首先

引发人们对“公务员下岗”的忧虑。

其实,DeepSeek等大模型接入政务服务系统中,数据处理方面优势显著,短板同样明显。缺乏灵活应变的能力便是其中之一。在政务服务大厅,遇到有情绪的市民,冷冰冰地就事论事解释政策也许并非最好选择,不仅要解决问题,还能安抚心情、倾听心声。也有市民直接找到政府相关部门反映问题,政策解读或法律科普固然重要,不过接待群众来访的第一步,恐怕是倒上一杯热茶,让来者坐下慢慢说。

新技术和新应用的诞生总会伴随着争议,有人开放,有人谨慎,有人跑得快, 有人仍眷恋传统。 即便有怀疑态度和警惕心理, 不可否认的是, 围绕DeepSeek等大模型的讨论已经从舆论场转向了实践场。未来更值得期待。

看老中青三代作家如何玩转DeepSeek——是“助手”还是“对手”?

重庆日报记者

(2025年2月28日)

对话嘉宾:许大立77岁,作家、重庆市新闻媒体作协名誉主席;吴向阳59岁,诗人、重庆市作协诗歌创委会副主任;南风子38岁,儿童文学作家、冰心儿童文学新作奖获得者。

2025年,AI写作工具DeepSeek的横空出世,不仅在科技圈引发热议,也在文学界掀起了一场“创作革命”。本期“圆桌读书会”邀请了三位擅长报告文学、诗歌、儿童文学的老中青作家亲自下场,聊聊自己用DeepSeek“玩”出的新花样。

AI写作究竟是创作的“助手”还是“对手”?在这场AI与文学的碰撞中,三代作家用各自的视角和方式,诠释了AI写作的潜力与局限。他们的探索不仅为文学创作注入了新活力,也引发了关于写作本质的深刻思考。

一、缺乏灵气的流水线“工业产品”

新重庆-重庆日报:我注意到最近三位都有玩DeepSeek写作的经历,能聊聊体会吗?比如写了什么体裁的文字,自己满意吗?或者有什么意想不到的效果?

许大立:龙蛇相交的新春时节,这世界忽然被人工智能大模型DeepSeek搅得地覆天翻。一时间网友文友给我定向投送帖子来,说这DS如何了得如何神奇,你们作家日子难过啊!

于是我就下载了DS,如法炮制。DS果然神奇,几秒钟就把文章写出来了,可谓禀赋天成。然而,必须选题准确、指令明晰,它才可能在海量信息里搜索并组织语言,形成你所需要的文字。一日,江津一老友来电,希望我能为他的同门老乡、江津荷花米花糖创始人吴永富先生用DS写一篇“米花糖赋”。考虑再三,还是决定试一试。拟定题目为《江津荷花米花糖赋》,并附上吴永富、吴萍父女俩数十年创立发展荷花牌米花糖的基本情况,指令用汉赋体裁。一分钟后,竟然跳出了赋文,读后大喜过望,它用汉赋体裁写出了文采飞扬的好文章。我立马转发几个群征求意见,居然获得高度肯定,有文友甚至说“以赋为生的写手们失业了”。最高兴的是吴家父女,来电致谢,并强调必须付酬。我笑曰:“DeepSeek不收钱,实在要付,给几包米花糖就好!”此后我又用DS写

了几首新诗,说实话也在一般水平之上。虽然没有诗人所作灵动有感,但是某

些句子还是贴近生活有哲思哲理的。

新重庆-重庆日报:许老师真是与时俱进,如此迅速地已结合人工智能把文字转化成生产力了。另两位作家也给大家分享一下体验故事吧。

吴向阳:我的朋友李元胜是诗人,也是工科男,他对AI和AI写作有心得,他的话我信。他说,DeepSeek写的诗,现在超过80%的初学者,几个月后能超过99%的初学者。这是他一个月前说的话。他还说,AI写诗达到文学杂志的发表水平不是问题。我以为,用“初学者”三个字,他是违心的——他怕冒犯活跃着的众多诗人,稳重是他一贯的风格——就像说阿尔法狗能赢99%的围棋初学者一样,那是在侮辱工程师。他对AI文学潜力的判断,我原则上同意。

南风子:第一次看到DeepSeek的文学作品,是在一个文学群里。有人发了它写的一篇关于某个城市的赋。我不由得来了兴趣,打开一看,发现这篇赋辞藻华美、用典丰富、结构完整、中规中矩。然后,又开始读第二遍、第三遍,却感觉这篇赋不对了。它没有大气磅礴的气势,没有汉赋带给读者的那种心灵震撼。它不是那种具有“人人笔下无”的唯一感的手工艺术品,而是“流水线”生产出来的让读者有似曾相识之感的“工业产品”。

为了印证这个看法,我请DeepSeek写了一篇主题是母爱的散文。它用了13秒写出了《母亲的手》。这篇作品以“手”为线索,串联起母亲缝衣服、煮馄饨、做茶、写信等生活的小细节。写法也中规中矩,文从字顺,从章法上来看是挑不出什么毛病,但是它太四平八稳了,没有一种好的文学作品应该具有的陌生感。它营造的温馨感是苍白的,读者难以产生代入感。作品中的小细节像积木一样搭建,没有一根以真情实感编织而成的文脉一以贯之。它是塑料做成的仿真树,不是以浓烈情感浇灌而出的——摇树干而树枝动、树叶舞的真树。

二、和DeepSeek做“反向朋友”

新重庆-重庆日报:三位的体验感都很有趣,那么对于文学创作中融入AI,

你的个人感受是什么?它是助手还是对手, 或者说如何和它做朋友, 与它合作?

许大立:不必讳言,其实在DS大神降临之前,我的写作偶尔也用到了AI。比如在撰文时,就用过“文小言”查过资料,写过演讲提纲。我感觉应用文、某些文科论文是可以使用DS来作为参考的,但他们能提供的都是概略性的条条框框,必须融入自己的观点和个性语言和独有的细节。

写小说、报告文学等体裁的文学作品,我个人以为,DS是难以胜任的。因

为他们只能编造故事的框架和大致走向,对于人物的内心活动乃至千变万化的

生活以及细节对话等,它们无法去描写,生活中的故事常常超越作家的想象力。

所以,AI介入写作只能是一种工具,操盘手还是得写作者本身。你要在写作中训练它、培养它,才能写出有文学性有个性的作品,而不是简单粗糙的文字组合。我是不写赋和古体诗的,我目前没有危机感。

吴向阳:汉语是一种成熟的语言,百年新诗是一种成熟的文学样式。诗歌美学也已成型,在近二三十年没有闪现新的思想。诗歌技术在上世纪八九十年代令人眼花缭乱的创新之后,没有出现有价值的新招式。可以说,成熟的材料、路数、标准、范式为训练AI写作提供了相当完备的条件。以当下AI的学习能力,在短时间内汇集并熟练掌握各个年代、各种路数的诗人的写作技巧,写出中规中矩的、“像诗”的诗歌作品,是不难的。

在我看来,诗歌是诗人情感能量的转移,诗人“发乎情”,经由灵感的催化,巧遇最合适的表达方式,固化到文字上,成为诗歌作品,对于写作者来说,这个过程带来的愉悦和成就感,是最为珍贵的体验,也是众多诗人坚守写作的基本理由。而带着诗人独特体验和独特表达的作品,获得认可,那是诗歌进入文化消费市场的额外价值(当然也是重要的价值)。AI诗歌,或者让DeepSeek、豆包等大模型辅助完成的诗歌作品,对于写作者来说,只是一件单纯的流水线产品,无法提供最值得拥有的精神价值。

南风子:文学作品的艺术性,与感觉的独特性、情感的独特性、语言的独特性密切相关。而这些从DeepSeek目前的表现看来,还达不到。我们和它怎么做朋友呢?我觉得可以做“反向朋友”:与DeepSeek写的作品“背道而驰”。

一部作品,DeepSeek这么写,作家就不这么写。因为目前DeepSeek写的作品是“华丽的平庸”“精致的俗套”,而文学佳作借用明末清初著名思想家傅山的书法理论来说,应是“四宁四毋:宁拙毋巧,宁丑毋媚,宁支离毋轻滑,宁真率毋安排”。

三、欢送一部分诗人离开诗歌

新重庆-重庆日报:三位作家都不约而同地提到人类写作的天然的不可替代性。如何自信地拥抱新技术,创作更高质量的作品,你有些什么措施或建议?

吴向阳:“你在写”,这就是一切,至于是在1%之中还是在99%之中,那是另一个维度的价值判断,可暂且放下。那些因为“写不赢”AI而退缩的诗人,那些借助AI谋求诗歌名声的人,他们的出发点是错的,行走的方向是反的。对

于这些人,我们列队、鼓掌,欢送他们离开诗歌。

许大立:AI是为人类服务的,所以我们不必过度担忧。简单劳动它可以胜任,复杂的生活它需要时间学习。至于作家或者诗人,如果沦落到靠AI写作,说明他已经油尽灯枯,没有了创作灵感,也难以指令AI写出好的作品。同时,某些作者喜好AI写作,似也没有违法,只要不违背伦理道德法律良心,自娱自乐,你也无权干涉或者制止。是吧?

AI不是敌人,而是文学营垒里的助手和战友,就看我们如何操作使用。某些技术性结构性资料性的问题它可以帮忙,而写作如人物个性、生活化细节及心理活动等,它是不能代劳的。此外,AI写作者也可自成一体,成立自己的文学社团,不和现有大脑写作者混流。还可以出版自己的刊物。AI写作也会有好作品出现。

南风子:对于DeepSeek,作家不应该忽视它,它至少告诉作家不该怎么写;作家也别太依赖它,尤其是年轻作家,长期使用它辅助文学创作,可能会使自己的心灵触角退化。

全省多个地市已部署上线DeepSeek,粤探索AI赋能公共治理

南方日报记者唐亚冰

(2025年2月24日)

前不久,深圳福田区70名“AI数智员工”上岗,可覆盖公文处理、民生服务、应急管理等240个政务工作场景,率先开启了“AI公务员”的“履职潮”。据公开报道统计,全省约有超三分之二的地市部署上线DeepSeek。

记者采访中发现,DeepSeek大模型在政务领域应用不断深入,不仅勾勒出人工智能与公共治理深度融合的可能图景,更折射出政府数字化转型的深层命题:这场由技术驱动的治理变革,将如何重构政务服务的运行逻辑?

一、DeepSeek本地化应用“爆单”

广州人工智能公共算力中心,是全国首个开放DeepSeek—R1671B昇腾适配版试用的政务级安全算力中心,也是广州市政务领域部署DeepSeek的关键支撑方。

“春节前我们完成了DeepSeek的适配工作,节后众多客户前来咨询技术解决方案,业务量激增。”李学军说。

这场热潮的引爆点,是算力中心1月28日上线的升级版DeepSeek。作为粤港澳大湾区人工智能基础设施的重要组成部分,广州人工智能公共算力中心支持DeepSeekV1—V3、R1等全量版本,涵盖671B满血版及7B、14B蒸馏小模型,支持在线推理、API调用、一键数据处理、模型微调及部署等,可支撑1000家企业同时接入。

这段时间,算力中心共为十个政企单位开展了DeepSeek的培训赋能,提供的专网DeepSeek试用次数日均超3万,多个政务AI应用带来持续正反馈。“我们希望尽全力让广州政务领域对DeepSeek‘研用、会用、好用、善用’。”李学军说。

与企业需求不同,政务服务关乎民生福祉,服务对象广泛且需求多样,这就更加凸显出开源模型的“定制化”优势。此外,政务服务的复杂性和动态性要求其使用的模型具备快速应变能力,开源模型“灵活性和创新性”的优势便得以彰显。政务部门可以依据实际需求对基于DeepSeek的模型进行二次开发,快速迭代,不断优化民生服务,比如在公共服务资源分配、政策宣传推广等方面,通过模型的持续优化,让政务服务更贴合民众需求。

二、技术落地是看谁跑得稳

当数字浪潮席卷政务服务领域,既要警惕技术应用伴生的风险,更需直面

技术革命对治理体系的全方位考验。

如何守住安全底线?“安全问题事关重大,未来在政务服务中大规模应用大模型技术, 一定要严格落实数据安全三法一条例, 以及配套规则标准的要求。 ”广东数字政府研究院院长余坦说。

面对挑战,李学军表示,在政务单位使用人工智能公共算力中心提供的模型时,保障数据安全与信息安全是核心任务,需重点关注数据全生命周期安全、模型行为可控性、系统攻击面管理三个方面问题。

“数字马太效应”是否会加剧区域失衡?余坦表示,一方面要加大全省统筹力度,通过省统AI基础能力,为各地提供服务的方式,降低粤东西北地区应用AI的门槛;另一方面可以考虑继续实施均衡化发展计划,适度向粤东西北地区提供资金和技术支持,鼓励探索。

“真升级”还是“跟风秀”?技术落地不是比谁跑得快,而是看谁跑得稳。“模型开源就像公开了一个工具箱,但真正关键的是如何利用这些工具解决实际问题,这才是核心竞争力。”李学军的比喻道破当前DeepSeek热背后的行业变局。

在他看来,当DeepSeekR1全面开源,靠贩卖API调用次数的传统盈利模式正在被淘汰。“因此,我们不做单纯的‘技术供应者’,而要成为‘AI应用领跑者’,助力并引导企业和开发者深度挖掘开源模型价值,将其转化为实际应用中的强劲生产力。”

只有以解决实际问题、提升服务质量为导向,将大模型技术深度融入政务服务的各个环节,才能实现从形式上的“跟风”到实质性的“升级”转变,让政务AI真正发挥其应有的价值。

众说纷纭DeepSeek北京商报记者魏蔚

(2025年2月10日)

日活超3000万,当DeepSeek以“开源免费”的颠覆性姿态入场,一场关于

技术创新、应用落地的深层思辨在科技圈掀起。

“免费用!免费用!这回是真的把提示词工程干死了”,不过LangGPT社区创始人云中江树向北京商报记者直言,“我的心态比较开放,社区建立之初就认为这是阶段性事物”。“单纯地追热度永远追不上”,枫清科技(Fabarta)联合创始人兼CTO杨成虎更关注DeepSeek背后的创新土壤。

不出意外的话,未来很长一段时间仍然是属于DeepSeek的时刻,从业者自

DeepSeek获得的热情、信心和加持,很快就能从产品端体现。

一、从“提示词工程”到“零门槛革命”

“GPT-o1出来时,我就感觉不怎么要写提示词了,但是一个月1000多元的订阅费是真贵,DeepSeek直接免费用,这回是真的把提示词工程干死了!”春节前,云中江树就下了定义。

作为国内最大的提示工程社区创始人,他告诉北京商报记者,“LangGPT社区的本质是分享AI玩法,我们建立之初就认为提示词是阶段性事物,我自己也做了自动优化的事情,AI真正要发展是要落地的,落地是系统性工程。国内社区型产品本身也很难获得融资和盈利,我们的心态比较开放”。

他用韦恩图来说明,人已知而模型未知的区域正在萎缩,人未知而模型已知的区域正在快速扩大,也就是说AI正在变得比专家还要聪明,提示工程要从面向过程的提示方法向面向目标的提示方法转变。云中江树给出一个公式:必要信息+清晰目标=高质量输出。

更大的变化在于,OpenAI通过API接口构建技术壁垒,DeepSeek选择将模型

架构与权重参数完全开源,这种“技术裸奔”策略直接打破了行业惯例。

“DeepSeek的背后是一支非常具有极客精神的团队,对技术充满理想主义,开源做得也很彻底”,杨成虎从DeepSeek第一个版本开始,就已经在关注深度求索(DeepSeek运营公司),不管从自我学习还是个人兴趣角度,他对DeepSeek都兴趣十足。

容联云大模型产品负责人唐兴才则向北京商报记者提供了一组数据,“经

过实际测试,基于DeepSeek,容联云在会话质检、会话数据挖掘等方面的准确

率提升了2—3个百分点”。

二、从“极限压缩”到“创新土壤”

成本、成本,2024年后半年以来,创新工场董事长兼零一万物CEO李开复多次强调,“中国工程师确实找到了各种方法来降低成本,提出了新的算法,设计了新的模型结构,大大加速了模型训练进程的同时,使其能够在能力较差的芯片上运行,无论是国产还是非国产芯片都适配”。

以DeepSeek等中国团队为例,“与美国团队之间的技术差距从两年前的七年缩短到了几个月,这是巨大的进步。训练成本降低到十分之一甚至更少,推理成本降低到大约三十分之一”,李开复说。

重要的是,这种极限压缩,不但没有影响大模型的能力,反而让业内人士

更相信AGI(通用人工智能)。

用心识宇宙(Mindverse)的创始人兼CEO陶芳波的话说,“整个春节的大部分时间,我都在捧着他们的每一篇论文,一边拍大腿一边感叹”。

他这样解读, “大模型训练是一个相当复杂的软硬一体的工程,而DeepSeek几乎重新设计了绝大部分关键组件:MLA、GRPO、DeepSeekMoE、DualPipe、FP8混合精度、R1-Zero、MTP等等。范围之广,密度之大,非常震撼。从学术视角看,这些创新中很多单拿出来,都达到顶级学术会议最佳论文的水平”。

杨成虎也向北京商报记者特别强调了创新,“持续可循环的创新土壤,对整个社会和广大技术创业者来说更有长期帮助,这个领域的发展是相当迅速的,单纯地追热度永远追不上,希望在创新的土壤下去创造热度”。

三、从“模型竞赛”到“应用比拼”

应用端的反应是检验技术的直接窗口。“春节后,我们收到的很多咨询不是有关算力的,而是想让我们帮助他们调用DeepSeek开发自己的应用”,一位云厂商相关人士向北京商报记者透露。

广东共建未来教育科技的负责人刘俊就想做开发,不过是间接的。“我想让DeepSeek帮我在应用开发服务商中筛选一家适合我们公司的,就像是买面膜,我只关注功效不在乎品牌,帮我在淘宝那么多商家里找到符合我要求的”,他给北京商报记者打了个比方。与DeepSeek互动时,他强调了价格透明,DeepSeek给了他四家公司备选,“我已经联系了一家”。

已推出应用的企业则快速接入,“DeepSeek有利于我们这种大模型应用企

业或者其他需要大模型能力的企业以较低的成本接入并使用相关技术服务,有效降低了技术应用门槛” , 唐兴才说,“容联云的大模型应用已经接入DeepSeek,我们在大模型之上根据不同行业和业务场景定制个性化的解决方案,从而推动银行、保险、证券、医疗等各个领域的数智化应用和发展”。

DeepSeek掀起的这场狂欢,本质上是中国科技创新范式转型的缩影。当开源策略打破技术垄断,当应用创新重构价值分配,当生态竞争取代单点突破,从业者正在见证一个新时代的开启。“我认为现在在中国,AI-First应用百花齐放的土壤已经具备,那些在移动互联网时代就具备优秀App开发能力的人,如今已经拥有了大展身手的舞台”,李开复说。