人工智能时代数字出版业“人-算法”边界问题分析
来源:编辑出版研究公众号 2022-11-03
分享到:

未来已来。每日经济新闻等一些出版业实体的变局正诠释这样一种现象,就是伴随着云计算、大数据、人工智能、区块链、AR/VR 等以算法主导的新技术在数字出版业产业流程中的渗透与应用,如同谷登堡革命所形塑的印刷文明一样,新的媒介技术带来数字出版业百年未遇的变局。新的媒介技术不但重塑了数字出版业发展新的基础设施加速了数字化进程,革新了数字出版业生产、传播、消费等形态,而且在推动数字出版业市场微粒化变革的同时,塑造了产业运营新的规则和尺度(如新的技术、市场、资本、管理等规则,数据要素成为生产核心要素之一),在激活全社会微资源(如普罗大众作为个体或节点进入数字出版领域)基础上,改变了数字出版业资源的配置方式(如通过全时全域连接的网络节点可在全球范围内实现产业组织、筹划、众筹等)。

然而,正如原子能技术既可造福人类又能毁灭人类一样,对于数字出版业来说,以算法为主导的新媒介技术发展应用也具有一体两面的特征,即数字出版业在享受算法等技术应用所带来的便利、效率、体验等好处的同时(如基于算法的策划、融媒体平台中算法自主审稿等带来的便利和效率),不可否认的是,数字出版不得不承受着算法等技术的滥用一面所带来的数字出版业生态中人的主体性丧失、职业能力退化等相关问题。

因而,在当前算法技术开始全面介入数字出版产业流程之际,数字出版业经营者需要思考这样一个问题:在特定历史时空里,对于一个健康发展的数字出版业,人与算法之间如何确立相互之间的边界,譬如如何分工、如何协同等,从而既能确保人的自主性、数字出版业的可持续发展,又能规避算法技术应用所带来的负面影响等。

本文拟以批判反思的视角,运用伦理学等相关方法或路径,从数字出版产业流程中所涉及的产业分工、产业情境和产业管理三个层面来考察数字出版业中“人—算法”的边界问题,借以抛砖引玉,以引起思考。

这里特别指出的是,本文所提及数字出版领域的算法,采取了一种较为宽泛的内涵。①从数字出版业层面来看,本文选择从人类精神生产角度,把属于精神内容生产的部分都划分到数字出版业里。这主要基于以下三个方面来考虑:其一,技术消融了出版业边界,数字出版内涵界定无论是从读者视角、产业视角和叙事视角都有其理论限度;其二,国家新闻出版行政管理部门也从更广层面上划分数字出版业类别,把电子图书、数字报纸、数字期刊、网络原创文学、网络教育出版物、网络地图、数字音乐、网络动漫、网络游戏、数据库出版物、手机出版物(彩信、彩铃、手机报纸、手机期刊、手机小说、手机游戏),都归为数字出版;其三,随着信息技术的发展,新的数字出版形态会不断涌现。②从算法技术层面来看,本文从更广意义上将算法内涵界定为用计算机来解决数字出版业发展问题的方法、步骤,即指面对不确定性世界,用计算机技术来不断提升数字出版业生产、传播、消费等生产或服务的品质、效率和体验,其所用到的执行计算、数据处理、自动推理和其他任务等技术解决方案的总称。这一宽泛内涵的选择主要是从算法不断变迁、迭代发展这一事实出发的。

一、 数字出版产业分工中“人—算法”边界

毋庸置疑,算法应用已成为产业生产中的一种技术标配,无论是宏观层面数字化、网络化、智能化等发展,还是产业微观层面的选题、策划、排版、审校、存储、分发、交互等各个产业环节,算法的作用越来越大,并且算法正以其高效率逐渐接管原先属于人的工作。如在信息及图书分发领域,算法推荐分发正取代人工分发。

从算法本质方面来看,算法既有其人性的一面,也有其物性的一面。一般而言,其人性的一面指的是算法包含着“人”的一面,即算法作为人类智力的创造物,它是特定的历史社会环境的产物,是人类征服自然、改造自然过程中的主体性、能动性、价值性和目的性的外化;而其物性的一面指的是包含着“物”(非人性)的一面,即算法的产生、发展均是以客观世界以及客观世界所提供的条件为依托,它是以认知和驾驭自然规律为基础的,违背自然规律、脱离客观世界的算法是不存在的。

在具体的数字出版生产实践中,算法作为“人造物”其人性的一面促进数字出版产业原主体——人的物化、去专业化。因为一方面,这种包含着人的意志、目的性的算法人性,是用来帮助解决数字出版生产等方面问题或满足产业特定需要的,例如生产中人的体力劳动、脑力劳动的非人性折磨等;另一方面,这种人性化发展的结果,即算法替代——让算法去做的结局是,长此以往会使从业人员被算法替代那部分素质或功能退化甚至丧失,如电脑打字使人写字能力减弱,语音输入可能使人提笔忘字。也就是说,在数字出版生产领域,这种算法人性化应用其部分或全部替代原本属于人的体力劳动和脑力劳动,或者直接替代人的部分器官甚至是人本身(目前主要是芯片植入、机器替代人的器官如假肢等)来感知世界,它极大地延伸人本身的器官、功能和活动等(如无人机拍摄),让编辑记者、经营者等从繁重或不愿意干的体力、脑力劳动中摆脱出来,编辑记者有时只要简单执行相关的算法程序就行,这种被“人造物”(算法)在产业链中不断替代的过程,就是数字出版产业发展过程中从业者被不断“物化”的过程,其实质是通过算法(技术具身)替代推动从业者去专业化的过程,编辑记者等只需要遵从算法技术规则进行傻瓜式操作即可(如语音输入不需要写字)。 

从从业者的方面来看,伴随着算法的不断迭代,算法在数字出版业中对从业者的劳动替代程度不断加深,在“算法进人退”的发展进程中,数字出版从业者的“物化”(算法技术依赖)程度越来越高,其专业能力越来越退化、弱化,而诸如虚拟数字人(如虚拟主播)的职业能力越来越强。这种退化现象又加深了数字出版从业者对算法技术的依赖程度,因为数字出版业发展更加需要依靠算法来弥补从业者的相关退化能力。如一项研究发现,由于导航的出现,伦敦出租车司机大脑皮层出现变化,道路记忆等功能出现衰退而加深了对导航的依赖等。这样发展下去的结果无疑是算法作为人类的制造物对人的支配力越来越强,数字出版业中从业者的自主性越来越弱。另一方面,伴随着算法技术如人工智能从弱智能向强智能方向发展,算法进化的逻辑是脱离人类掌控、拥有自身所独有的逻辑和规则独立发展(如算法自主处理某方面问题),并且还有朝着成为支配人类力量的方向发展的趋势。如人工智能不用经过人类许可自主地处理数据并采取相应的行动、芯片替代人的记忆等等。现实的例子如 2017 年 8 月 8 日,四川九寨沟发生地震,中国地震台网中心机器人 25 秒自主写出 540 字地震报道并有配图。 

当数字出版领域算法替代使得从业人员变得越来越不能自主(没有算法就难以解决问题)时,当算法不再仅是更好地满足人类数字出版业信息传播需求、提升数字出版业信息传播效率与体验的“算法物”时,算法可能成为支配力量。因此,数字出版领域需要努力探索构建一种合理的、以增强人的自主性为基础的“人—算法”边界,以防止人、算法滑入失控的发展轨道。从近期看,在数字出版业产业流程中,需要探索构建以下产业生产中“人—算法”边界的发展模式。 

(1)发展理念方面。算法在数字出版产业流程中,无论是对从业人员体力劳动还是脑力劳动的替代,这些从某种意义上被视为人类自我解放、自我超越的技术方式或手段,都要建立在增强从业者自主性、促进从业者自我发展及不失技术掌控的基础上,算法发展应用不是以推动从业者本身“物”化、让算法自主、从业者失去对技术掌控为目的,更不是以机器替代就不要从业者参加劳动为宗旨,而是实行新的劳动分工,即从业者从低层次重复劳动中解脱出来(算法替代),变为从事更高级别的创造性劳动,并以此为基础不断进化人本身。这种发展理念应当体现在构建一种规则来规制数字出版业算法模型的规划、设计和具体实施。 

(2)发展方式方面。其一,强化人的主导性。算法参与数字出版业生产“应当提倡人本主义,强调身体对技术、真实个体对云个体的主导,让算法传播更好地服务于真实个体”。其二,探索构建新的劳动分工制度。新的“人—算法”间劳动分工制度,要实现的不仅是人机劳动协同,更是人机在新的劳动分工基础上协同进化。人类需要在这种新的劳动分工格局中通过新劳动实践实现人的进化迭代并实现对算法的掌控。如果只有算法对人的劳动替代,在“用进不用则废”的进化规律作用下,这种替代会给人类本身及人类文明发展产生消极影响。因为“劳动创造了人本身”,对于人来说,体力劳动和脑力劳动对于人类来说本是一体,并且是人类进化的根本,体力或脑力任何一面的退化都会对人类全面发展产生影响。算法技术对人类智力劳动的替代,譬如目前数字出版业实践中,算法写作、算法摄影、算法构图、算法剪辑等数字出版生产应用中,从业人员有时只需要一些简单化、傻瓜式的操作即可,长此以往可能会带来人员相应能力的退化。有研究认为,人类的大脑正不断地被智能科技“重新塑造”,已影响人类智力发展。

因此,数字出版领域“人—算法”的边界应是,算法的进化迭代应与从业者本身以及相关规则的进化迭代同步进行,算法对劳动的替代应以构建新的劳动分工格局为前提,这种劳动分工格局应以促进从业者的主体性、全面发展或者以促进这种进阶为依托,并以维持对算法的掌控并促进人本身进化发展为目标。

二、数字出版产业情境中“人—算法”边界

在数字出版产业生产中,人与算法是在一定的情境中进行的,新的信息技术尤其是算法发展应用使得产业情境越来越算法化,越来虚拟化。譬如除了休息外,编辑记者在由算法构建的虚拟空间里待的时间可能超过线下时间。中国互联网络信息中心发布的第 48 次《中国互联网络发展状况统计报告》显示,截至 2021 年 6 月,我国网民人均每周上网时长达到 26.9 个小时,也就是说,网民平均每天有近 4 个小时在网上。 

刘兴亮曾在《新京报》撰文《从逃离现实的互联网,到逃离互联网的现实》,“十几年前,互联网是一个可以逃避现实的地方,而现在,现实是一个逃避互联网的地方”。此二元划分法说明了算法技术环境下人类二种生存情境(空间):真实的物理世界与虚拟世界。若再结合法国哲学家列斐伏尔的空间理论来分析当下数字出版从业者生产情境的话,可以把从业者生产情境细分为三个形态不同、相互关联的情境(空间):其一是存在一个具体、真实的物理实体空间(通常称为线下),譬如数字出版企业在线下讨论选题;其二是存在一个基于个人视觉、听觉、味觉、触觉等感官感知环境建构起来的个人化的虚拟空间(大脑所建构的存在于意识当中的个人隐秘世界),如数字出版从业者对每篇稿件阅读后所建构的属于个人的虚拟空间;其三是通过算法等信息技术(如计算机、电子信息、仿真技术)所搭建的、模拟的、具有沉浸感的一个虚拟具象世界(通常称为线上),如数字出版从业人员工作中相对公共的电脑空间。

这里所讨论的是数字出版生产中所面对的线上线下两种产业情境(空间)的“人—算法”边界,其中线下主要指真实的物理世界,线上主要指算法建构的虚拟世界。

目前,数字出版从业者工作的产业情境形态主要表现为从数字出版领域的消费互联网、产业互联网到元宇宙,从数据躯体、人工智能、AR/VR、数字孪生到万物互联等,算法营造了从业者生产环境数字化、网络化、智能化、沉浸化。伴随着算法不断迭代进化,算法技术介入数字出版产业链越深,数字出版业产业情境正在显现以下三种发展变化趋势: 

(1)算法塑造了数字出版业生产、传播、消费等过程虚拟化的数据分身(各种在数据挖掘分析基础的用户画像、虚拟人),技术化的模拟“自然”环境(如数据化新闻《雪崩》),网络化的“社会”环境(如网络社群等)等。梅罗维茨在《消失的地域》一书中说,媒介形式的转变会创造出新的信息系统,相应地会形成一个新的情境。算法作为一种新的媒介塑造了上述新的情境,这种情境融入现实物质世界的人、自然环境、社会环境等运动系统中,原有信息环境、社会环境的和谐与平衡被破坏,相应会带来一系列数字出版领域新的问题,如数据主权问题;读写文化、电子文化与网络文化间的冲突;虚拟社交与现实世界交往间的冲突;新旧价值体系之间的冲突等。

(2)算法所创造的虚拟化的数据分身、技术化的模拟“自然”环境、网络化的“社会”情境正在取代线下物质世界的人、自然环境、社会环境而变身为主流,在加速了数字出版业产业环境虚拟化的同时,有主导数字出版业生产、生活、社交和娱乐等基本规则(线上虚拟化规则)的趋向。这种规则又加速了数字出版业产业情境的深度虚拟化。 

(3)算法所形塑的虚拟数字人、数字规则、虚拟世界等虽然是一种将现实物理世界及相应规则挤入边缘的貌似强大的力量,但其本身却存在很大的脆弱性。因为这个虚拟的数字世界里,数字出版企业作为一个大的节点正陷入一个大虚拟世界里,数字出版业连接的不仅仅是人与人、人与物、物与物等,也不仅仅是与传统媒介、新媒介及各种 APP(如手机平台、车载平台、可穿戴设备平台)之间的连接,而是无远弗届、无所不包、无所不连——从家庭到工厂再到广场、车站,从空调、冰箱、灯泡等到电机、机床、车间再到手表、戒指、手环等等,它带来的不仅仅有这个虚拟世界的多元性、复杂性、沉浸感,还有多重危险性。这表现在:当所有人和物等都接入网络以后,一方面,接入点越多,暴露的点就越多,暴露面越广(用户行为、年龄、地位、身份、电话号码、位置、消费习惯、银行账户等),可能发动攻击的“敌人”、可能被攻击的点(接口)就越多,防守的压力也就越大。另一方面,接入人与物越多,接入层级越多,对攻击点攻击造成的破坏程度可能越大,破坏的范围可能越广,每个人可能都会深陷其中。 

因而,在产业情境方面,无论是从发展角度还是从安全角度来说,数字出版业需要探索构建一种“人—算法”边界,这种边界是人与算法协同发展进步、安全的产业情境模式。 

理念上可从两个层面去思考:其一,正确认识算法情境的两面性。数字出版从业者要认识到在其享受着算法所营造的数字出版产业环境以及所带来的沉浸体验和信息满足时,必须直面算法对产业环境的改变与重塑,承担这种变革所带来的负重。同时,要知道,由算法技术所呈现的信息技术环境、网络社会环境及虚拟主体(人的数字或数据分身),其作为实现人类目的和意志的人造物,与现实的自然界、人类社会和人本身是有很大差别的。其二,构建立足于算法情境运用的新价值体系。要不断探索建构产业情境“人—算法”价值观,算法等技术塑造诸如元宇宙等虚拟人、数字规则、虚拟世界,其目的是为了精准、高效、多元、便利地满足人们的信息需求,而不是取代或边缘化数字出版从业者的立身之本——现实物质世界、人与社会以及其进化运行规则、价值体系。即算法技术塑造的世界及其规则应以真实的物质世界、社会、人、自然情境中的价值追求和运营规则为主导,以实现人的自主性、主导性为基础,推动线上线下两个世界的协同进化(包括时间与空间方面平衡),更高效地为人类美好生活服务。 

实践上可从三个层面来考虑:其一,构建产业情境运用中的平衡机制。数字出版业需要探索线上线下两个产业情境(空间)之间在时间上的平衡。对于虚拟空间与真实世界空间的态度,谁取代谁、厚此薄此都是不对的,需要探讨构建虚拟情境运用规则机制,而不是放任虚拟情境规则的任性与野蛮。其二,构建产业情境运用中的目标导向,即引导人们以真实的物质世界作支撑并真切地拥抱它,引导人们在复杂、多元、实体的情境世界里寻求真实的自我、自主、自由与主体性,而不是总沉浸在自我想象的技术虚拟情境空间中。其三,构筑产业虚拟情境使用中的安全体系。数字出版业要探求构建虚拟情境中的安全体系,警钟长鸣,保护数据主权,防止破坏。

三、数字出版产业管理中“人—算法”边界

从人的主体性角度来看,管理决策是数字出版业生产中除主体、情境外考察“人—算法”边界的第三个因素。目前,在数字出版业生产的管理决策中,基于大数据基础的算法管理正在接管产业流程各个环节如策划、市场、生产、服务、广告、财务等领域。随着大数据收集、挖掘、分析技术的不断进步,算法管理变得越来越重要,并且有替代经验决策模式成为产业主导决策管理模式的趋势。这表现为,在数字出版业决策管理领域,一切围绕数据说话,如生产、经营、决策、执行等向数据看齐,如图书看销量、阅读看流量、好坏看收益等。

从发展的角度来看,建立在大数据基础上的算法管理是一种先进的企业管理手段。它的好处在于能在某种程度上为管理者面对不确定市场时提供判断的量化精确依据;作为一种管理模式,在一定程度上能节约管理成本、提升管理效率。

但是,算法决策管理的模式在数字出版业实际应用层面有不可克服的缺陷,这表现在:

(1)通过大数据采集挖掘分析所形成的用户画像如个体、群体、机构画像的识别、描绘、预测和判断,与现实对象存在着相当的误差。因为这些基于评分机制得到的数据化、标签化的“数据主体画像”所用的算法模型是在有限知识或有限样本基础上得到的,其用于算法训练与分析模型的数据更多依赖旧时数据,与实时数据存在着时间差;用于算法学习训练的数据是有限的,它主要产生自用户与各种平台连接时留下的痕迹,同时,它不可能穷尽每个个体的数据,根本无法与现实世界的丰富性相类比。 

(2)算法管理依赖数据,但并不是所有对象都适用于数据算法管理决策,因为作为算法管理前提的数据本身是建立于“可量化”“可测量”的基础上的,事实上很多现象是无法量化和无法测量的。况且量化、测量过程不可避免地受到主客观环境的影响,产生概率的偏差,这些不可克服的因素会扭曲“数据主体画像”,即影响对数字出版业运营数据的科学评估,甚至消灭基本“事实”。因此,用算法评价以及基于个体、群体、机构数据采集、挖掘、分析来替代人力成为社会管理、治理的主导方式时,就有可能会导致一些偏见、造成歧视或不平等等,导致管理风险问题。如淘宝、京东书店上的图书评价,豆瓣网上的电影评价等就存在误差,很可能对数字出版管理决策造成误导。同时,数据收集的质量与数量会影响算法管理模型设计的效果,也就是垃圾数据出垃圾算法。 

(3)算法参与管理的本质是部分或完全替代人的管理,在这一过程中,个人的作用或能力可能越来越退化、弱化、边缘化,对应的算法管理越来越重要,并且可能会在管理方面强化对人的主导,其结果是会削弱数字出版业管理者的能力。与此同时,可能会导致以下两种后果:一是会数据主义盛行,数字出版业管理模式将从更富人性的“请遵从自己内心的想法”转变为数据主义时代的“请听听算法的建议”,数据算法主导的社会,难免会产生由数据算法带来的对人的自主性、文明发展的伤害;二是在算法盛行的管理领域,算法管理模型常常由于其设计者本身的利益导向,而出现片面追逐流量、点击量、转发量、评论量等运营模式,从而在实际运营中,算法管理可能会成为算法“致恶”的帮凶,如“标题党”现象,低俗内容,百度搜索引擎“魏则西事件”等。

因而,数字出版产业管理领域,也需要构建一种“人—算法”边界,这种边界建立的前提是算法管理替代不了人之管理,不是强化算法管理使之成为一个脱离人类掌控的、独立的、支配人的力量或规则。目前,可从以下方面去探索: 

理念上有两个层面的问题值得思考:其一,数字出版业要认识到算法管理尽管代表了一种先进的生产力,但是算法管理在量化过程及算法模型设计的同时也存在着无法克服的局限(如认知的局限),从而也有可能会导致数字出版业管理决策错误;其二,一旦算法管理决策模式成为数字出版产业的主导模式,则有可能让管理者的决策能力及判断能力退化、让人的自主管理决策退场,从而可能导致算法管理成为一种脱离人类掌控的支配力量。在数字出版领域,销量至上、流量至上的管理模式是有弊病的,它忽视了数字出版业作为精神生产领域的社会效益的一面。

实践上可尝试探求以下措施:①构建算法管理的人与算法协同规制,这种规制的目标是寻求在算法管理中,强化数字出版业管理者主导的算法管理模式,强化人与算法协同进化、人与算法协同管理的模式;②构建算法管理中的数据管理边界。由于算法依赖数据,算法管理中还有可能存在由数据收集、应用、处置等而导致的“人—算法”数据边界问题。目前需要在以下方向进行探索:其一是寻求建立算法管理中数据收集的边界。目前,算法收集数据无所不用其极,大多数用户对算法在后台收集其个人数据不知晓或不明确,处于弱势地位。从家庭到工厂,从私域空间到公域空间,算法管理为收集数据介入的场景越来越多,如无处不在的传感器和监控设备介入社会生产、生活和工作场景,算法收集的数据品类繁多,公私界限不明。这些数据收集方式要设立相应的边界。其二,寻求建构算法管理中数据处置的边界。目前,一些超级综合型 APP 平台,利用免费使用 APP 换取用户数据的原则,掌控了数以亿计用户的各种层次数据,如社交关系数据、位置数据、商务数据等等,超级平台利用存储在服务器里的用户大量隐私数据不断强化训练算法,反过来会强化对用户的掌控,在商业利益的诱惑下,会做出损害用户、社会利益的行动,导致互联网杀熟现象等。这些超级平台在数据处置方面也需要设置边界,如从推动算法透明性、公共性原则角度出发,规定数据处理不能损害用户主权,让用户知晓数据应用、处置等。其三,寻求搭建算法管理中数据安全边界。数据是数字出版业中极其重要的要素,平台所收集的用户数据,一旦失控,将给企业、个人和社会造成巨大损害。因而需要给算法管理所带来的数据收集、应用、处置、安全等设置相应边界,确立相应的权责归属等。 

总之,在算法主导的数字出版业管理中,由算法管理引起的数据问题也应引起人们的重视,数字出版业发展需要探索构建算法管理所牵涉的“人—算法”数据边界,包含数据安全、数据隐私、数据主权、数字垄断等社会广泛关注的问题。

四、结语

算法技术在颠覆现有数字出版业产业流程、组织结构的同时,也带来了相关风险。“技术向善”还是“技术纵恶”,这种媒介化社会的永恒议题将考验算法研究者、开发者与规制者等群体的智慧。从数字出版业发展需要来说,要确立“人—算法”相关边界,算法要与人及人类文明同时进化,算法发展并不是让算法独立成为精神内容生产的一种自主力量,更不是让其成为数字出版业及人类文明的掌控者,这些可能会发生在未来场景的问题,人类一定要预先有所研究、设计和考量,要以大智慧构建一种算法发展与应用的正确航道。

面对算法革命所带来的高度不确定的数字出版业未来,需要立足于人类文明发展高度,从规制“人—算法”数字出版边界的角度,确立技术进步、创新与应用的模式、速度和范畴,建立起数字出版业发展的阈限。