黄璜:理性看待大模型在数字政府建设中的应用
访谈嘉宾:黄 璜 北京大学政府管理学院教授、博导
访 谈 人:唐 鹏 数旗智酷创始人、首席研究员
(本文内容根据访谈录音整理)
Q:过去三十年,互联网对政府运作形态的影响主要在于“透明政府”、“整体政府”、“服务型政府”的建设,您认为大模型(是否)将进一步对数字政府的未来发展产生哪些根本性的变化?
A:大模型作为人工智能发展到新阶段在应用领域呈现的一种表现形态,我们对大模型的价值与影响都需要理性的认识和理解。当我们在面对大模型所带来的影响时,需要讨论与思考的不仅仅是大模型本身,而是正在泛化到社会各个层面的人工智能技术的影响。而就人工智能或者大模型对数字政府发展的影响而言,我们当然可以持有诸多美好的想象和期待。但需要注意的是,大模型作为一项新兴崛起的智能技术,人们“想象能做的”和“实际能做的”是两回事——风行于媒介针对其技术特点的理论推演与它在实际应用场景中真实发生的价值,这完全是两回事。
如果我们相对务实地从技术赋能的角度出发来思考未来政府的形态,那么,除了对常规性、重复性、劳动密集型工作的替代与辅助之外,那些知识密集型的管理工作也可能有逐步被人工智能替代的风险。而我们需要看到的是,人工智能不仅将为政府带来更加高效、公平、透明和一体化的治理效能,以及获得对未来的预测与洞见,同时,当我们将执行甚至决策的过程都交给技术来完成时,很多未知的风险也将浮现。
Q:从“搜索即服务”到“对话即服务”,大模型对未来的政务公开、政务服务的模式与体验将产生怎样的影响?
A:首先,我们应该认识到“对话即服务”的假设是以 ChatGPT 的应用体验特征为前提的,而大模型不等于 ChatGPT。如果从政务服务领域的需求模式来看,借助类 ChatGPT 技术,应该可以更好地推动公众与政府之间的对话与互动,对提升政府透明度、政务服务能力显然具有重要价值。
其次,通过连续性的对话互动,政府侧可以获得更为精准的用户需求信息,公众侧也可以获得更为简明易懂的政策信息或服务指南。以政务公开为例,虽然政策解读、信息图解等自上而下推行多年,但即使到现在我们看到很多公开的政策内容和信息还是“政言政语”,作为研究人员去理解都很吃力,老百姓肯定更加看不懂。因此,如果没有有效的互动对话的支持,用户看不懂也没法问,政策的社会效应自然会大打折扣。虽然很多政务服务平台提供了 Q&A 问题或帮助系统,用户不懂的地方可以提问,但最终输出的内容依然是标准化的书面文本。大模型对政策解读的介入可以建立个性化、更友好的对话方式,在不增加政府侧人力成本的前提下,可以更好地提高政府与公众的互动性。而这一切的前提是大模型可以在政务领域满足我们所期待的目标,毕竟政府垂直领域的大模型应用需求跟通用型以及其他行业大模型还是存在较大差异。
Q:政府拥有大量的数据资源,哪些类型的数据更适合大模型,公文类应用大模型是否合理?
A:我们应该将大模型看作为一种“杂食动物”,所有的数据都可以进行“喂养”,不存在哪类数据是否适合其进行训练的问题,但前提是要搞清楚我们的应用目标是什么。假如我们要做的是一个小范围的决策支持型应用,在确保数据安全的前提下,我们甚至可以灌入一些关键的非公开的敏感数据。如果是一个面向公众的社会化服务应用,我们可以选择性剔除一些可能对服务均等化产生干扰的数据。因此,大模型的数据选择及偏好应该是因需求和场景而异的。
对于大模型支撑公文写作而言,目前国内已有一些城市在应用,但这里不存在合理不合理的问题,主要在于我们如何使用。举例来说,比如现在各大城市开展的“一网统管”工作,其中一个工作流程环节就是周期性数据的汇总与分析,利用大模型来快速输出数据报告,这是完全可以的。因为“一网统管”相关的数据主要来自12345热线、网格员以及其他报送渠道,机器对数据的自动整理、总结的能力和效率远远高于工作人员的手动整理。比如南方一个城市的某些区县的网格数据报告已经从以前的按月度或季度报送,现在可以做到半天就输出一次数据报告。
我们都知道公文有很多模板化、套路化、格式化的内容,在某些应用场景中甚至只需要对往期内容稍微变动格式然后更新数据即可,这样的公文内容实际上对智能化的要求并不高。但是,有些公文要对未来提出具有创见性的设计或观点,或者做出深入的分析,发掘数据背后的隐藏信息,这个依靠大模型目前可能还解决不了。因为要做出深入分析与洞察隐含信息,需要结合经验、环境以及行业知识的综合研判来完成。
Q:在城市治理与应急中,大模型可以如何帮助政府机构更好地应对突发事件和紧急情况?
A:我们可以讨论大模型具体能做什么,但如果我们讨论政府如何用大模型来应对治理状况,就不是特别合适。我们一定不能将大模型作为目标,而是政府如何利用技术来解决自身的问题,帮助它们提高效率和服务价值。如果以数据科学为例,在面对一个城市治理场景时,我们可以利用大数据,也可以利用样本数据,这背后是政府如何去平衡解决一个问题的成本与收益。比如针对人群聚集或群体事件,当然可以使用大模型去预测和研判,但是我们也可以使用手机信令数据去监测人流趋势,并对事件态势可能的走向进行分析、模拟和推演。
如果我们要讨论大模型在城市治理中的应用价值问题,这个问题的核心应该是,在同样的治理场景下,大模型能否提供更具性价比与更高成功率的解决路径。
此外,我们还需要注意,城市治理的过程总是会遇到新问题,可能每时每刻都会遇到不同类型的问题,而大模型的推理能力是依靠过去的数据训练而来的,因此,“过去的”大模型如何解决“未来的”新问题,这是需要进一步探讨的。当然,算法通过对规律的发现给出程式化的解决方案也是一种思路,但总会有超出算法边界的新问题出现。
Q:大模型将对政务服务、政府决策将产生哪些挑战?如何打破数据歧视、“AI幻觉”以及对偏见的固化等?
A:数据歧视、“AI 幻觉”等问题与挑战是数字技术发展过程中面临的共同问题,一方面不是大模型或人工智能出现才遇到的问题,另一方面也不是技术本身的问题,是源自数据采集与训练的问题。
如果要直面这些挑战的话,以司法领域为例,比如法院判决依靠 AI 系统肯定是不行的,将生成式人工智能应用引入到社会公平正义裁决的领域,需要非常审慎。机器可以支持和辅助决策,而不是代替决策。机器通过数据与算法来提供不同场景的方案选择,或者通过判断人的形态、语言、行为等来断定是否符合嫌疑人特征,这背后只是一种概率。大模型在司法领域并不能代替法官和律师的专业知识与职业经验。
政府行为是不能根据概率的高低来决策的。如果将概率高低来作为政府决策、法律判决的依据,那将过于简单粗暴。此外,对于数据非结构化程度比较高的领域,比如城市规划、产业选择等重大决策,至少目前看来是机器还无法企及的。
Q:生成式 AI 应用是否会成为主流的政务服务入口,对现有政务数字化供给(比如原有信息系统、政务云的建设)会产生哪些冲击?
A:虽然现在数字政府与数字治理领域都在提倡“用户至上”、“应用为要”等概念,但一项数字化应用能否成为主流,可能还无法简单地依靠“好用”来判断。一是从供给层面来看,对一款政务服务应用的决策——做还是不做——并不完全是以服务性能来衡量,会兼顾很多因素考量。比如如果这款政务服务应用的确非常好用,但被广泛使用后很难监管、负外部性很强怎么办?这可能就会影响政府侧的建设决心或推进方式。二是从需求层面而言,如果老百姓对生成式 AI 在政务服务领域的应用需求很大,那我认为就有可能成为主流甚至顶流。
但是,生成式 AI 应用对于政务服务而言是否会是一种“先进的”、“优质的”服务?这一点是值得探讨的。比如我们现在打开搜索平台或者微博热搜,会给我们推荐很多视频,对有休闲需求的用户而言,推荐视频肯定越多越好。但假若我们需要快速获取信息、提炼要点并迅速转向下一个办事流程或目标的时候,文字信息的获取效率肯定比视频更快,这也是为什么视频平台会开发“倍速”功能的原因,本质就是便于部分用户加快信息获取的速度。
那么,AI 大模型对话、模拟人的互动交流以及生成式 AI 的背后本身就存在一个“生成”的过程而非直接呈现,所以从信息获取效率的层面来看,能否成为“主流政务服务入口”,从需求侧而言是不确定的。但从提升信息搜索的精准度、办事事项串联、资料辅助等方面而言,大模型相对于目前的政务服务模式应该具有相对较好的体验创新。
至于大模型是否会对目前的政府信息系统、政务云等造成冲击,我想主要还是在算力供给层面的影响与需求。信息系统也好,政务云也好,这些都是支撑数字时代的政府在线上和云端完成不一样的流程和工作。政府的行政程序讲究“依法办事”,这个“法”是通过编码规则内嵌在信息系统内的,大模型的价值应该在于加速、减缓或创新某个流程,但要去替代原有的流程工作和业务模式,至少目前来看是很难的。