随着数据要素的深入应用,各领域对海量数据的挖掘和运用无疑正预示着新一波生产力的增长和智能化浪潮的到来。与此同时,诸如隐私问题、数据质量问题、有偏决策问题等实际问题,也使得大数据的使用面临重重挑战。“在决策场景中,人类认知仅能直接处理有限的部分‘小数据’,即大数据的一个子集,难以反映大数据全貌的小数据导致了决策的有限理性。”从这个角度出发,中国人民大学商学院副院长、教授张瑾创造性地以“大数据—小数据”问题为切入点,聚焦于如何从大数据中提取最优价值的小数据,他期待可以用小数据反映大数据在不同决策情景下的语义全景,并通过“以小见大”的洞察提高基于小数据的管理决策质量,实现数据要素利用效率的提升。保持着“研究基础问题,讲好中国故事”的研究初心,张瑾正在让数据“更实用”“更好用”的道路上全力前行。
▲张瑾在出席学术会议
小大之辩——填补数据要素应用短板
与数据“深交”多年,张瑾亲眼见证了大数据使用场景的逐步拓展,也看到了相关研究深刻的现实意义。特别是在数据被纳入生产要素范畴后,如何对数据进行治理和管理以提高数据使用效率,就成了他要着力研究的核心问题。
“和超市货架类似,数据治理就是将数据先‘分类’再‘上架’,以便于用户根据需求进行数据取用,并据此制定高效策略的过程。”然而在大数据驱动管理决策的场景中,张瑾敏锐地发现,这条“流水线”的运转并不十分顺畅——尽管管理决策者希望通过大数据获得决策情景的“全景图”,但在实际决策场景中却仅能直接处理有限的小数据,这意味着许多决策事实上是基于小数据进行的。大数据与小数据之间存在的语义差异,使其难以反映大数据的语义全貌;这意味着小数据会导致决策者做出有限理性决策,进而拉大基于大数据决策与基于小数据决策之间的效果差距。为了破解数据难以“以小见大”的困境,张瑾决定从个体、企业和市场3个典型决策情景出发,逐一破解“大数据—小数据”的应用难题。
针对企业舆情管理这一企业数字化管理活动中的重要一环,张瑾及其团队首次提出了“代表性舆情信息”的概念。从信息覆盖、信息冗余、信息分布的角度入手,他们搭建出企业代表性舆情信息的理论框架,并进一步完成了企业舆情信息聚类算法的开发,以及企业代表性舆情信息提取方法和评价测度的研发。从“代表性”信息角度切入,他们为这一科学问题提供了包含理论框架、信息组织方法、代表性信息提取方法和评价测度在内的全新解决方案。这一具有创新意义的研究成果,不仅为张瑾及其团队赢得了多项奖励,也为他们带来了与企业深度合作、将相关成果进行应用转化的机会。如张瑾团队基于代表性信息提取框架和方法开发的“企业博客代表性信息提取系统”,顺利为我国某电信运营商解决了员工管理和创新提案分析等问题,获得了公司好评;他们研发的代表性信息提取方法也为西安一家科技公司解决了海量农业大数据的分析和处理问题,取得了良好的经济和社会效益……不唯如此,这项可应用于公共管理层面的成果,同样可以为提高社会信息服务质量提供强大助力。
此外,张瑾还将目光投向了在中国发展迅速并逐渐形成世界级规模的电子商务场景,着力解决其中蕴含的“大数据—小数据”问题。“在消费者的数字化购物场景中,‘读评论’是一个非常重要的环节。商品的评论有没有全部看完、消费者能不能准确对其进行解读,都将最终影响消费者对商品的认知,进而影响其购买决策的精准性。”张瑾解释道。面对这样的挑战,他首先研发了考虑消费者浏览行为一致性的意见提取方法;此后,他又提出了考虑消费者视角全面性的一致性意见提取方法,通过信息熵理论构建考虑消费者视角全面性的一致性信息子集提取框架,并设计了高效的提取方法。在此基础上,张瑾再次提出了考虑消费者视角结构的一致性意见提取方法,进一步从消费者视角结构一致性的角度构建了在线商品评论的一致性信息提取模型,并顺势提出了一种从大规模在线商品评论中快速提取一致性意见子集的方法,在兼顾消费者话题结构和消费者意见两个维度一致性的同时,还对收敛的算法特性进行了优化渐进。功不唐捐,在回答“视图一致性”科学问题的基础上,这一取得国内外多项奖励,被多次报道并收获社会广泛关注认可的成果,也在解决其他类型平台信息服务和公共政策分析等问题的过程中展现出巨大的应用潜力。
在回答了企业和个人层面的“大数据—小数据”问题后,张瑾的研究对象也“由小及大”——他带领团队开始关注市场智能化竞争中“大数据—小数据”问题。在他看来,市场竞争信息也是一种典型的大数据,而从海量市场竞争信息大数据中发现和提取有价值的小数据信息并进行管理决策,将有助于企业在市场竞争中提前确立优势。就此,他带领团队迅速从中介维度空间的搜索、间接传递链的发现等关键维度入手,先后提出了市场竞争者信息的提取方法和市场竞争程度的计算模型。利用关键词之间的间接关联模式,他们提出的两种基于隐性联系的竞争关键词提取方法,有效克服了传统竞争者识别研究的局限性;在此基础上,他们构建的市场竞争程度二部图计算模型和品牌销量预测模型填补了领域内模型的空白,并为使用者提供了精度更高的模型工具。这些研究成果回答了市场竞争分析过程中“隐式关联发掘”的科学问题,并为这种隐式间接关系的挖掘和提取开拓了更为广泛的管理应用场景。据了解,这一成果已在新兴科技领域得到应用,为相关企业在提供市场竞争分析、替代性技术发掘、产业关键技术识别等层面提供了有力的方法支撑,节约了大量研发成本。
“在算力不足或者‘未知全貌’的情况下,我们希望可以通过小数据及相关技术、算法,帮助管理者克服过去仅凭经验、理论框架或传统方法做决策的局限性,为他们搭建用数据做决策的方法体系,让更多的中国企业、管理者乃至整个市场以‘以小见大’的方式分享大数据时代在管理层面的便利。”张瑾总结道。而在这些成绩背后,他的动力之源,正来自他赤诚的初心、不变的追求。
扎根实际——在现实世界中解决真实问题
“我要做怎样的研究,才能更好地为国家和社会创造价值?”这样的疑问自张瑾在清华大学计算机科学与技术系完成本科和硕士阶段学习后产生,敦促他转投清华大学经济管理学院的信息管理方向开展博士期间的学习和研究;更在选择工作时,让他与时任中国人民大学商学院院长毛基业教授产生共鸣——“当时,商学院偏重于使用社会科学的研究方法去解决相关问题,而毛教授的想法在相关研究中提高了自然科学研究方法的‘解题比例’,从而使相关研究兼具理论和技术的双重优势。”具有计算机技术及管理学双重研究背景,在博士期间即拥有丰富实践经验的张瑾无疑是颇具竞争力的人选;而中国人民大学商学院作为国内高校中名列前茅的学科平台,也同样为他提供了施展抱负的广阔舞台。“用更为综合的视角发掘新的着力点、用相对特殊的方法解决管理问题、用全部热情去探索更有价值的科研成果”,怀着这样的想法,张瑾于2013年正式入职中国人民大学商学院。
▲张瑾在课堂教学
求学时导师陈国青教授“用管理学的思维去理解和回答时代的问题”的谆谆嘱托,以及进入工作岗位后中国人民大学商学院定期开设的学术研讨会,不仅让张瑾对自己所选的科研道路更加笃定,更让“技术出身”的他迅速成长为能以“工程与社科结合”视角展开综合研究的卓越人才。在团队组建的过程中,他也将这样的心得经验应用其中。在“既关注技术又关注管理”的氛围熏陶下,团队深入交流探讨、互相学习,一次次地触及社会和行业的真实需求、捕捉惊鸿一现的研究灵感。
“时至今日,管理学走到了既引入工程思维、又重视传统研究的范式,并将二者充分融合以获取创新突破的时间点上。”而“生逢其时”的张瑾,在以执着进取的姿态带领着团队逐步完成多层次、多学科的人才梯队建设的同时,也将这样的热忱投注到教学工作中。
在张瑾看来,立德树人是培养学生过程中最有价值的一环,而言传身教则是他践行这一目标的具体办法。“我自己的学生我都会全程参与带教;如果是本校直博,那我会在他大三的时候就开始引导他的学习和研究工作,这个相处的时间就更长。”而带给学生的第一堂课,就是从学者的角度来看待和思考问题。“科学研究不能‘想当然’,要从多角度思考其必要性和可行性。让学生以导师或领头人的身份对自身的研究内容或成果进行评估,帮助学生将‘学生思维’逐步转变为‘学者思维’‘实践思维’,会使他们的研究更具实践价值。”
与此同时,张瑾也强调了志存高远的重要性。曾被导师“要在一个领域当中持续深挖,即使遇到困难也不能够放弃”的要求深深激励,随后专注研究十余年的张瑾认为:“科研不能浅尝辄止,对其中核心的内容更要像钻井一样地进行深入、持续、全面的研究,才能打造出不可取代的独特优势。当然,在这个过程中学生难免会遇到困难、挫折和迷茫的时候,此时我会根据每个学生的具体情况进行鼓励、指导和帮助,身体力行地带领他们渡过这段‘搁浅的险滩’。”
在此基础上,从自身的经验出发,张瑾要求学生“紧紧盯着为社会作贡献的角度”,去做对社会有用、社会也认可其价值的研究。“能一直为社会作贡献,也证明社会或产业的进步没有抛弃你。将科研工作与社会需求紧密结合起来,是科研之路得以长足发展的秘诀所在,也是科研工作价值得以体现的重要形式。”
除此之外,张瑾团队一定程度上担任了“点灯人”的职责。作为商学院副院长,张瑾在日常工作中主要负责面向社会实践者、业界企业家的非学历学位教育。在他看来,向真实管理者传授先进管理理论和方法是一个极佳的“互通有无”的机会,这会在一定程度上提升相关企业的管理水平,也为张瑾及其团队提供了“从实践中来、到实践中去”的验证机会。“从实际出发的好处就在于此,我们可以将科研内容与培训内容有机结合起来,让相关成果不仅在课堂上绽放创新的光彩,更要让这批特殊的学生‘听得懂、用得上’。”张瑾解释道,而他的努力也实现了“触类旁通”的积极效果,“基于团队内部对管理学和工程之间的交叉思考,解答具体场景下的具体问题,不仅让我们收获了成果,也以‘光点’的形式,为不少合作者、从业者打开了解决管理问题的新思路。我们的一个小研究或许并不显眼,但如果能以此启发大家关注相关研究领域,形成多学科、多场景、多维度优势互补,并以多角度合力,催生更多更好的研究,我们团队上下都会觉得非常开心”。
如今,在国家自然科学基金项目课题的支持下,张瑾就大数据管理与分析、数字经济与人工智能、商务智能与数据挖掘等领域的关键问题提出了一系列独特见解和先进方法;与此同时,他也关注着消费场景下的数据治理、数据交易、计算竞争等前沿领域,并基于自身和团队在交叉领域的优势,不断探索着用新理论、新技术、新方法响应使用者需求,耦合复杂交互场景的可能性。
谈及未来发展,一贯谦和而低调的张瑾笑着说道:“专注于科研和教学,我们要做好两件事:一方面,我们将持续创新,希望自己和团队的研究成果能够为社会发展贡献力量,也能够获得相关企业和管理者的认可和肯定;另一方面,我希望学生觉得在我这里读博士是有收获的,能够得到切实启发和帮助;更希望他们在毕业后走得更高、变得更强,我认为‘青出于蓝而胜于蓝’是教师价值得以凸显的方式之一,期待我的学生成长为比我更好的学者。”