杜新忠戒毒网--戒毒门户 权威媒体
联系杜新忠:13757963812 | 网站地图
戒毒专家—杜新忠记事 余杭强制隔离戒毒所收治自愿非列管成瘾物质人员
首页 > 当前位置:>禁毒综合 > 毒品犯罪 > 正文
毒品犯罪
博弈论视角下毒品犯罪治理问题——以G省B村毒品犯罪治理为切入点
2026-03-17 10:08:13 来自:《国际禁毒蓝皮书(2024)》 作者:李春 郭昌宁 阅读量:1
  摘要:面对日趋严峻的禁毒形势,各国探索了“一体两借两断”、“网格化”、“多学科综合”等毒品犯罪治理体系,但均存在一定局限性。博弈论的引入则提供了新思路:基于G省B村毒品犯罪治理情况搭建的博弈平台分析发现,博弈主体在形成阶段易出现信息不对称现象,引发“逆向选择”等问题;在决策阶段,犯罪发生场域是影响犯罪决策的关键;在终局阶段,仅靠刑罚威慑或福利政策无法得到博弈均衡的最优解。为消弭治理罅隙,从“未然、在然、已然”阶段构建毒品治理体系:其一促进信息充分流转,促使犯罪决策者做出“正向选择”;其二把控时空因素,严控犯罪场,防止客观毒品犯罪行为的形成;其三以控需为主导,抑制毒品滥用,减少需求市场,管控毒品替代品并加强反洗钱合作,从而形成动态三层次毒品犯罪综合治理体系。
 
  关键词:博弈论 毒品犯罪 动态治理 犯罪场  情境预防
 
  21世纪以来,世界范围内的毒品犯罪治理面临新困境,在对传统毒品和新型毒品进行严控背景下,大量替代型的新精神活性物质(New Psychoactive Substances,NPS)的出现,对药物监测、控制和公共卫生应对措施的传统方法提出了挑战。我国毒品犯罪率连续多年居高不下,毒品犯罪态势愈加严重,毒品犯罪治理研究具有批判态度和反思精神,集中表现为批判我国对毒品犯罪过于严厉的刑事政策。
 
  然而,毒品犯罪治理领域的两大新变化却经常被忽视:第一,我国毒品犯罪率已悄然发生了变化,基于最高人民法院的统计数据,2012年至2021年,我国毒品犯罪案件数量呈抛物线形变化趋势,在2015年达到历史最高点,此后开始持续回落,2021年的数量已回到2012年以前的水平;第二,在严厉打击传统毒品与新型毒品的态势下,毒品的价格不断升高,而相对容易获得的新精神活性物质常成为毒品供给的替代品,目前市场上的NPS种类已从2020年的555个增至2021年的618个,其中87个为首次发现。2020年后,许多国家的药物滥用情况加剧,加拿大、德国、奥地利和比利时等多国的处方阿片类药物的使用量显著增加。在境外,学者们普遍认为,易制毒化学品管制对打击冰毒等毒品生产影响有限,因为制毒者能迅速调整并使用替代方法来制造冰毒。还有学者认为,刑事治理手段存在较大局限性,因为现今新精神活性物质的滥用危机是健康危机而非刑事危机。
 
  由此可见,如何使研究面向未来才是毒品犯罪治理领域的关切点之一,这迫切需要一种更具预测性、可能性的毒品犯罪治理方式。但目前的毒品犯罪预防与治理理论纷呈,效果不一,均无法全面有效治理毒品犯罪。毒品犯罪不能仅靠刑罚予以事后惩戒性治理,也需进行事前和事中治理,方能标本兼治。而博弈论的综合性、动态性、层次性或针对性的研究体系,能针对毒品犯罪,为其搭建治理体系提供研究框架。所以,本文通过对既有治理或预防理论的审视反思,试图在博弈论视角下构建毒品犯罪治理体系,以期对毒品治理有所裨益。
 
引言
 
  (一)理论爬梳:犯罪治理的概念审视
 
  在各学科领域中,基于人与社会、自然关系的梳理,在“人们有组织应对犯罪的措施和实践”概念归纳上尚未达成共识。如在刑事政策学领域中,一般称其为“犯罪对策”或“犯罪打击”;在刑法学的语境中,往往将其归纳为“犯罪惩治”或“犯罪惩罚",刑罚报应思想色彩浓厚;在刑事执行学场域中,将其解读为“犯罪矫治”或“犯罪处遇”;在社会学范围中,将其称作“犯罪控制”或“社会控制”;在犯罪学研究中,常将其称作“犯罪预防”或“犯罪防控”。从犯罪学角度而言,“犯罪预防”是最重要的目的,虽然“犯罪防控”同时包含“预防”和“控制”的内涵,但涵摄范围有限;而“犯罪治理”概念指人类有组织地对刑事犯罪、一般违法行为以及社会越轨行为进行打击、控制和预防的应对措施、策略和实践。它既能全面辐射应对犯罪的措施的理论和实践,又涵盖“犯罪预防”和“犯罪防控”的研究旨趣。其结构关系如图1所示。
 
  本文所研究的“毒品治理”并不局限于以上学术概念理论桎梏,而是尝试结合现实案例和刑事一体化思路,从博弈论视角出发,探索如何完善治理体系,如何走有中国特色的毒品问题治理之路。
 
  (二)实践模式:毒品犯罪治理体系探索
 
  就当前毒品犯罪治理模式呈现来看,以下几种治理体系实践具有一定代表性。
 
  第一种,“一体两借两断”的毒品犯罪治理体系。其中,“一体”指治理政策随毒品犯罪变化而一体化推进,“两借”指借助他国和国际力量,“两断”指切断供给和需求。这是世界范围内最常见的一种毒品犯罪治理体系之一,但其具体表现形式是多样的,不同国家的侧重点也存在差异。譬如,欧美等国的学者和实务人员比较关注不同地区与不同群体滥用不同种类毒品的原因和治理对策,以及着重关注阿片类药物危机所带来的风险,普遍使用了定性或定量的实证研究方法,但缺少对整体的毒品犯罪治理体系进行总结。虽然加拿大采用的是预防、执法、减害和治疗四大支柱的治理体系,实则并未脱离“一体两借两断”的范畴。若将“一体”、“两借”和“两断”并列看待,易忽视毒品犯罪治理动态变化中的重点难点问题。
 
  第二种,毒品犯罪网格化治理体系。主张将毒品犯罪治理的事前、事中、事后三层次与减少供应和需求的策略相结合,构建出一个以两条主线交错的呈网格化的毒品犯罪治理体系。该治理体系实际将“一体两借两断”毒品犯罪治理体系的“两断”单独拿出,再将其按毒品犯罪的发生顺序划分为事前、事中、事后三个阶段,淡化了“一体”和“两借”在其中的地位。其强调切断毒品供给和毒品需求的重要性,提升了“一体两借两断”毒品犯罪治理体系的层次性、针对性,但也存在缺陷。譬如,无法充分展现犯罪行为选择与犯罪治理决策之间的动态对抗,也忽视了毒品犯罪治理的动态变化。
 
  第三种,多学科综合治理体系。有学者将我国现今毒品犯罪治理体系总结为:价值理念上基于家长主义立场的极化处置,矫治吸毒成瘾者并强控毒品供给端;制度上立足分治毒品供需市场的二元框架,模糊禁毒法制内部各法域的功能区间,强调综合治理;方法上以运动式打击为主,兼顾常态化治理。中国现今学界普遍认为应对毒品犯罪问题进行综合治理,其核心是鼓励运用多学科知识和方法构建治理体系。譬如,犯罪学领域的学者从供需理论出发,认为“两断”治理措施仍是必要的;社会学领域学者基于选择理论认为,毒品犯罪是“社会人”受传统习俗影响与对熟人的社会信任做出的感性选择,支持“硬控制和软控制相结合”的治理方式;心理学领域学者认为,涉毒犯罪在部分群体中形成了负面的“从众”效应,认为可突破传统“堵源截流”的方法,探寻榜样引领等新型治理方式。目前在执法实践中提出了“清源断流”的治理方法,但综合治理体系与“一体两借两断”的毒品犯罪治理体系仍存在一定重合之处,在该治理政策下需要强化有针对性的具体措施。
 
  总之,上述毒品犯罪治理体系各有所长,但也存在一定缺陷。为全面有效治理犯罪问题,亟须在宏观整体的国家治理体系之下,探索构建一个具备综合性、层次性、动态性和针对性的毒品治理体系。
 
  (三)他山之石:博弈论的引入和借鉴
 
  自龙勃罗梭时代以来,犯罪学就具有交叉学科的特性,即使学界不否认毒品犯罪治理本就是犯罪学的重要课题,但目前学界借鉴犯罪学和经济学等学科的研究范式检讨毒品犯罪治理尚不多见。借助已经成为经济学的标准分析工具之一博弈论,研究“当博弈主体在利益相互影响的格局中,如何使自己收益最大化的策略选择问题”,在金融学、生物学、国际关系学、计算机科学等学科运用广泛,但在犯罪研究上却鲜有问津。
 
  博弈论为搭建毒品犯罪治理体系提供研究框架的可能性和可行性。具体体现为:第一,综合性,博弈主要有四要素——博弈主体、博弈规则、博弈结果和博弈效益,这是一个完整、综合的研究框架;第二,动态性,博弈各方有先后顺序,行动在后的一方可观察行动在前一方的战略选择并做出选择,所以从这方面看,毒品犯罪的治理属“动态博弈”(dynamic game);第三,层次性,博弈分析过程体现在三个阶段——博弈形成、博弈决策和博弈终局,这能与事前、事中和事后的三层次犯罪治理规律相对应;第四,针对性,博弈论不但能基于研究样本进行针对性研究,也能舍弃其中随时空等因素变化而出现的某些变量,抽象出具有稳定性和共性的因素。
 
  具体而言,在毒品犯罪治理博弈格局中,博弈分析过程主要体现在三个阶段。
 
  首先,在搭建博弈平台过程中,需要确定博弈主体、明确博弈规则。其一,确立几方博弈主体;其二,承认理性人假设,犯罪是权衡成本与收益后的理性抉择,若博弈主体的选择是非理性和不可预测的,那么博弈效益的计算毫无意义;其三,明确博弈形成的重点在于信息充分流转,“游戏进行的前提是先让玩家知悉游戏规则”。
 
  其次,在毒品犯罪治理的博弈过程中,博弈主体各自进行策略选择。其中,博弈主体之一的犯罪决策者受各种因素形成的“犯罪场”影响,会选择犯罪或不犯罪,前者为犯罪人,后者则为潜在犯罪人。而犯罪治理决策者等对犯罪决策者的正向引导也集中于“犯罪场”之中,所以控制“犯罪场”是治理毒品犯罪的关键。
 
  最后,博弈主体决策后形成博弈终局,不同的决策组合呈现不同的博弈效益。博弈者的每一种策略都会形成一个收益结果,但收益结果有时不符合预期,因为一方的收益会在博弈下受另一方牵制。因此,博弈最优解实际是一种“均衡”。在犯罪治理决策者采取治理策略时,犯罪决策者要获取的最大收益只能是不犯罪,此时双方的收益都为最佳。
 
  博弈论视角下的毒品犯罪治理分析过程可如图2所示,即从研究样本入手,进行数据剖析和个案分析;在研究设计中运用研究假设、数学建模、博弈分析、进行犯罪预测;之后在“未然、在然、已然”三层次得出研究启示,从而探索提升治理能力,构建动态环境中全链条多层次的毒品犯罪治理体系。
 
  一、研究样本:G省B村的毒品犯罪图景剖析
 
  作为新型毒品的主要种类,苯丙胺类毒品的使用流行率在北美地区最高,其次是东亚和东南亚。中国G省作为曾经的新型毒品犯罪严重地区,制贩毒犯罪和走私毒品犯罪时常发生,其后的治理效果有目共睹。“偶然事物的发生始终受某些隐蔽着的规律支配,问题关键在于发现这些规律。”因此,以G省B村的毒品犯罪图景为样本进行剖析,从而总结治理经验,对探索毒品犯罪治理体系有现实意义和理论价值。一方面,该地的制毒活动曾呈“家族式运作、产业化经营、地方性保护”的态势,体现了毒品犯罪的社会危害性;另一方面,该地毒品犯罪反复泛滥,反映了毒品犯罪的动态变化性和治理复杂性。
 
  研究设计中,在中国裁判文书网分别以“B村”和“毒品”为全文检索的关键词,设置案由为“走私、贩卖、运输、制造毒品罪”,审判程序为“一审”,文书类型为“判决书”。除重复的和与研究无关的判决书,最后得到有效的裁判文书共计104份。以裁判文书为分析样本,再结合其他文献资料,以G省B村为视角的毒品犯罪情景及图表分析如下。
 
  (一)犯罪种类:产供销全链条犯罪且生产型毒品犯罪突出
 
  从检索到的样本中看,被判为容留他人吸毒罪的案件有1件,占比0.96%;被判为包庇毒品犯罪分子罪的有2件,占比1.92%;被判为运输毒品罪的有4件,占比3.85%;被判为窝藏毒品罪的有5件,占比4.81%;被判为非法买卖制毒物品罪的有8件,占比7.69%;被判为非法持有毒品罪的有13件,占比12.5%;被判为贩卖毒品罪的有16件,占比15.38%;被判为制造毒品罪的有55件,占比52.88%。B村相关毒品犯罪的判决案件数量及其占比如图3所示。
 
  样本涉及的毒品犯罪包括制造毒品罪等八种,基本涉及毒品犯罪“产供销”全链条,其中当地制造毒品等源头性毒品犯罪较为严重,占比52.88%。从涉案毒品种类来看,绝大部分都为甲基苯丙胺,缴获的海洛因占比很小。同时,也查获了大量麻黄草等易制毒化学品原料,该地制毒原料来源广泛,涉及福建、河南等多地。从检索到的裁判文书可知,B村制造的毒品不少是为了贩卖。这与国外研究存在差异,有学者对24个国家的125名制造甲基苯丙胺的犯罪人进行调查,发现其中有近半数的人生产甲基苯丙胺是为供自已食用。从表1可见,根据2012年到2020年的数据分析,生产型的毒品犯罪在B村占比最高,为50%以上;其次为供应销售消费型毒品犯罪,其中贩卖毒品占比最高,约为15.38%;容留他人吸毒犯罪和包庇毒品犯罪分子犯罪占比最少,约为1%-2%。可见犯罪种类表现为“产供销”全链条犯罪且生产型、源头性犯罪突出。
 
  (二)犯罪主体:亲缘纽带是共同犯罪的桥梁
 
  有学者在2011年将我国毒品犯罪主体特点用八个字来概括,即:城镇、年轻、男性、无业。但在现今,村民参与毒品犯罪的人数已然不容忽视。B村高达八成的毒品犯罪案件为共同犯罪,同案人数最多达9人。在这些共同犯罪的案件中,亲缘关系明显,有57.58%的案件至少存在两名亲属参与。其中,有的是夫妻同行,有的是父子结伴,有的是兄弟姐妹共同联手,还有的是远近亲戚助阵,甚至全家一起参与。
 
  近几十年来,我国G省依托对外开放政策成为全国经济最活跃地区之一,人口流动速度加快,贫富差距拉大。随着人口流动增速与信息流转便捷,B村部分村民掌握了制毒技术,并对其他村民进行传授。由于当地超过七成村民从事第一产业,整体收入低,致富欲望和利益驱动使部分村民冒着被判处严厉刑罚的风险集体实施毒品犯罪,具有亲缘关系的团体更容易形成犯罪主体。
 
  (三)犯罪场域:世界范围辐射与制毒场所转移
 
  一方面,因为特殊的地理位置,涉G省毒品走私路线辐射范围广泛。G省集散毒品的辐射范围涉及全国及世界范围内的50余个国家和地区,仅2007年至2014年,G省全省法院就判处外国籍毒品犯罪人约400名。从毒品走私路线看,有学者早在2009年分析了世界范围内涉中国G省毒品走私路线,并将其分为海上与货运方式走私毒品路线和行邮方式走私毒品路线,其中海上与陆路货运方式走私毒品路线主要有五条,而行邮方式走私毒品路线主要有三条。然而,走私线路随时在发生改变。譬如,由于2022年中国云南和泰国与缅甸边境的毒品巡逻力度增加,导致中国和泰国当局的冰毒缉获量有所下降,因为贩毒者转向其他海上航线:通过缅甸中部将大量物资运往安达曼海。Lorraine Mazerolle等基于澳大利亚十余年间生产、供应和持有案例的警方数据进行实证分析发现,虽然追踪系统可以降低人们在国内生产甲基苯丙胺的能力,但似乎不太可能影响甲基苯丙胺的走私问题。
 
  另一方面,基于此消彼长的客观规律,犯罪治理中产生了“犯罪转移”现象。尽管2012年“雷霆行动”后G省的毒品辐射集散地位逐渐下降,但禁毒形势仍旧严峻。从犯罪场域看,“雷霆行动”行动开展后,毒品犯罪的“主阵地”由城市半公共空间逐渐向室外公共空间和室内私人空间转移,“雷霆行动”对大毒枭及贩毒团伙的打击成效突出,促使2014年贩毒案件大幅度下降。2018年数据分析发现,G省的制造毒品犯罪正向G省东部和西部地区转移,呈现以制造毒品犯罪重点地区为中心向外扩散趋势,并且制毒人员也随之外流至周边省份地区,以往较少发现制毒活动的西北、东北地区制毒活动上升明显。此后,境内制毒犯罪逐渐隐蔽化、分散化。侦破的难度加大。同时,境外毒源难断难清,多边合作打击毒品犯罪任重道远,试图限制毒品走私进口的努力常常失败。总之,国内毒品供给量目前得到了一定程度控制,但因毒品供给市场的客观存在,东南亚、中亚、北美地区等主要毒源地仍虎视眈眈。
 
  二、研究设计:毒品犯罪治理的动态博弈
 
  由于博弈主要有博弈主体、博弈规则、博弈结果和博弈效益四要素,而博弈平台的搭建需要明确博弈主体和博弈规则,博弈结果的得出依赖博弈主体的决策选择,博弈效益则基于各种博弈结果的计算。所以,博弈论视角下的毒品犯罪治理体系可分为形成、决策、终局三阶段。
 
  (一)博弈形成阶段:博弈平台的搭建
 
  1.确立博弈主体
 
  为充分搭建博弈平台,本文假设毒品犯罪治理过程中主要存在三方博弈者:犯罪治理决策者、犯罪决策者和犯罪治理决策实施者。
 
  其一,犯罪治理决策者可通过立法划定犯罪圈实现“决策先占”。譬如,我国《刑法》规定了走私、贩卖、运输、制造毒品罪等12种毒品犯罪,除引诱、教唆、欺骗他人吸毒罪,强迫他人吸毒罪和容留他人吸毒罪是明确可归结为控制毒品需求的毒品犯罪外,其他大多为控制毒品的供给链。
 
  其二,犯罪决策者包括潜在犯罪人和犯罪人,两者属于犯罪决策结果的一体两面。虽然研究样本主要为毒品犯罪人,但毒品犯罪治理强调整体性、综合性、动态性,潜在犯罪人的决策是动态的,具有转化为犯罪人的可能性,因此博弈主体的犯罪决策者也包含潜在犯罪人。
 
  其三,犯罪治理决策实施者是重要的博弈主体之一,能影响犯罪决策者的策略选择。检察机关报道,“雷霆行动”后两年内,G省已侦查毒品犯罪“保护伞”案件约40件,如S市公安局原党委副书记陈某涉嫌徇私枉法、受贿案。
 
  可见,在B村的毒品犯罪中,犯罪治理决策实施者的决策对犯罪决策者的策略选择产生过影响。
 
  2.明确博弈规则
 
  基于理性人假设,部分犯罪决策者可能受利益驱使实施犯罪。犯罪治理决策者应当对决策的实施进行监督,犯罪治理决策实施者一日犯罪将负担刑罚成本,社会价值也会遭受相应损失。所以,犯罪治理决策者对犯罪决策者和犯罪治理政策实施者可选择的行动有两种——监督和不监督;犯罪决策者可选择的行动有两种——犯罪或不犯罪;犯罪治理决策实施者可选择的行动有两种——实施或不实施犯罪治理决策,也可用犯罪或不犯罪表示。
 
  在明确博弈规则过程中,信息流转是关键一环,因为信息获取的全面性与真实性决定了博弈者战略形成均衡的可能性。由于各犯罪决策者接收信息的客观条件与能力不同,尤其在我国B村等广大农村地区,村民接收治理
 
  “决策”的途径和能力相对匮乏,这导致三方博弈处于信息不对称状态。其主要表现为:第一,信息客观分布不对称,一方比他方占有更多信息,作为潜在犯罪人的村民常处于信息劣势地位;第二,信息地位主观认知不足,各方对已方在信息占有的地位认识相对模糊,犯罪治理决策者同样无法知悉犯罪决策者的信息接收程度以及其选择犯罪的具体方式、时间。
 
  这种信息不对称会导致“逆向选择”问题。由于犯罪治理决策实施者拥有犯罪治理决策者不知的隐蔽信息——犯罪决策者的真实状况,所以在监督不力情况下,犯罪治理决策实施者为谋取非法利益,易受犯罪决策者诱惑而实施犯罪。并且,法网疏漏、执法不严向犯罪决策者传递了易逃脱法律制裁的信息,这能激发犯罪意图。在样本中,部分犯罪分子正因发现毒品犯罪利润高、能以不法手段逃避司法裁判等信息,从而无所顾忌地实施毒品犯罪。图4表明了三方博弈平台搭建中的博弈主体及信息流转对行动选择的可能性影响。
 
  (二)博弈决策阶段:客观毒品犯罪行为的形成
 
  1.博弈主体的策略选择
 
  在博弈过程中,博弈主体不同的行动顺序会产生不同结果。假定各方行动顺序为:犯罪治理决策者行动→犯罪治理决策实施者行动→犯罪决策者行动。依此,可绘制博弈树,如图5博弈决策树所示。
 
  2.影响博弈策略选择的因素
 
  犯罪原因难以穷尽,而犯罪场的构成要素相对明确,所以控制犯罪场比控制犯罪原因更具可行性。从构成因素类型来看,犯罪场主要由时、空、被害人和社会控制等构成,主流观点认为毒品犯罪属无被害人犯罪,所以主要包括时、空和社会控制等因素。犯罪场与国外的情境预防理论有相似性,但侧重点不同:情境预防将环境条件归于犯罪控制论,我国一般将环境条件纳入犯罪原因论,而犯罪场是犯罪原因论与犯罪控制论之间的联结点。由于犯罪原因无法穷尽且难以控制,所以可通过情境预防改变毒品犯罪的时空条件,侧重从增加毒品犯罪的成本和提高犯罪难度、减少犯罪机会的立场出发治理毒品犯罪。犯罪场作用过程如图6所示。
 
  一方面,特殊时空条件促成毒品犯罪热点区域。G省优越的地理条件促其成为毒品走私贩运的集散枢纽,其海岸线绵长,港口密集,海陆交通便利,B村树林密布。独特的地理区位可降低犯罪风险,村内环境复杂便于隐蔽制毒场所,便利的交通便于毒品分散转运。
 
  另一方面,社会控制的疏漏使毒品犯罪有机可乘。其一,存在司法控制不足和公权力腐败等正式社会控制疏漏。犯罪分子通过违法犯罪手段收集警方侦破毒品案件的信息,并在警方行动前通知涉案人潜逃,腐蚀国家机关工作人员,使犯罪人逃避审判。其二,存在乡村基层自治失控等非正式社会控制疏漏。20世纪80年代以来,G省农村宗族出现了复苏,B村至今仍是一个以亲缘纽带为核心色彩的“乡土”社会,而“乡土”社会有属于其自身特色的治理方式,这会对信息的充分流转造成一定阻碍,形成非正式社会控制疏漏。
 
  (三)博弈终局阶段:三方动态博弈的均衡解
 
  为对博弈结果进行求解获得博弈效益均衡,现进行以下假设。
 
  第一,假设犯罪治理决策者授予犯罪治理决策实施者的公共权力集合为X,其中Z∈X,而Z的价值为V。当犯罪治理决策实施者滥用职权时,Z的价值集合会损失ΔV,而犯罪治理决策实施者会获得ΔV的非法收益。但是,当犯罪决策者给予犯罪治理决策实施者αΔV的行贿金时(0<α<1),犯罪决策者获得了(1-α)ΔV的收益,公共资源Z的价值损失ΔV。
 
  第二,假设犯罪治理决策者监督的成本为C,不监督的成本为0。当犯罪治理决策实施者的犯罪行为被发现时,会被处以βΔV的刑罚惩罚(B>1),β为犯罪治理决策者给犯罪治理决策实施者的惩罚系数。当发现犯罪决策者给予犯罪治理决策实施者αΔV的不法利益时,犯罪治理决策实施者将被处罚αβΔV。同时,犯罪决策者也会受到处罚,为(1-α)βΔV。
 
  第三,当犯罪治理决策者监督时,能发现犯罪治理决策实施者的不法活动,处罚所得将归其所有,收益为βΔV(此时犯罪决策者未被处罚)或2βΔV(犯罪决策者也被处罚);当犯罪治理决策者不监督时,不能发现犯罪治理决策实施者和犯罪决策者的犯罪行为。
 
  第四,假设犯罪治理决策实施者的基本收入为W,当犯罪治理决策者发现犯罪治理决策实施者有滥用职权或受贿等犯罪行为时,犯罪治理决策实施者失去合法收人W,而犯罪治理决策者获得收益W。
 
  假设犯罪治理决策者实施监督的概率为P1,犯罪治理决策实施者犯罪的概率为P2,犯罪决策者犯罪的概率是P3。采用“逆向归纳法”可求得均衡解,此时实现了博弈均衡,客观上能得到最大效益:(P1,P2,P3)=(1/(β➕1),[(C➖W)/ΔV(1+β)]-1,1)
 
  1.犯罪治理决策者的均衡解分析
 
  犯罪治理决策者监督的概率P1=1/(β+1),说明其概率与α、ΔV和C等均无关,只取决于处罚的力度(即惩罚系数β),β越大,P1越小。这表明犯罪治理决策者给犯罪决策者的惩罚系数越大,犯罪治理决策者监督的必要性就越小。即对犯罪决策者的刑罚越严厉,犯罪决策者选择犯罪的可能性就会减小。
 
  尽管我国刑法对毒品犯罪规定了高至死刑的刑罚,但B村的毒品犯罪依然泛滥,这说明刑罚威慑效应存在一定局限。此外,当治理政策使惩罚超过犯罪收益,虽然能让犯罪数量下降,但定罪增量可能加大治理成本。因此,单纯提升刑罚严厉性威慑毒品犯罪不符合治理成本最小化的要求。
 
  2.犯罪决策者的均衡解分析
 
  犯罪决策者实施犯罪的概率P2=[(C-W)/ΔV(1+B)]-1,受C、W、ΔV和β的影响,具体的影响关系如下。
 
  当C、ΔV、β确定时,犯罪决策者合法收益W越大,犯罪的概率P2越小。这是因为,犯罪决策者不依法实施决策存在风险,当合法收入带来的激励能满足需求时,即使存在收益,犯罪决策者也大概率不愿犯罪。
 
  当β、W、ΔV确定时,犯罪治理决策者监督所花费成本C越大,犯罪决策者犯罪的概率P2就越大。因为成本C越大,犯罪决策者的贿赂对象便相应增加,对国家工作人员实施贿赂犯罪行为的空间越大,犯罪的概率P2越大。
 
  3.犯罪治理决策实施者的均衡解分析
 
  当犯罪决策者期望的收益最大时,犯罪治理决策实施者犯罪的概率P3=1。即当犯罪决策者有利可图时,其与犯罪治理决策实施者共同实施犯罪的概率为1。这表明,犯罪治理决策实施者与犯罪决策者极容易在利益的驱动下,形成非法的互利关系。
 
  (四)小结
 
  博弈分析结果既支持严厉刑罚,又提倡激励性治理措施,若兼顾两者可取得良好治理效果,但将使有限的社会资源不堪重负。若单方强调实施刑罚威慑或激励型策略,又无法达成博弈效益均衡的最优解。所以,现阶段无法否认犯罪决策者实施毒品犯罪的必然性。故应深入分析,针对毒品犯罪的特点对症施策。
 
  1.仅靠威慑或激励措施无法实现最大效益
 
  毒品犯罪的特点在于利用市场供需交易机制进行犯罪,毒品市场的均衡是随犯罪需求和供给的变化而变化的。单方面打击毒品供给市场,导致毒品价格上涨,无法真正抑制需求,因毒品滥用存在成瘾性,并且毒品利润上涨反而吸引更多潜在犯罪人为逐利而实施毒品犯罪。Benjamin Petruzelka基于2006-2018年捷克及其邻国对含有伪麻黄碱药物的监管与捷克甲基苯丙胺市场之间关系的案例进行研究发现,在单个国家或地区内收紧药品监管会导致毒品市场和供应链发生不良变化,即国内毒品供应链国际化,有组织犯罪集团参与毒品犯罪的概率增加。
 
  结合研究样本看,B村制贩毒犯罪被“清剿”的同时,国内丙胺类毒品供给也出现了下降趋势。据历年《中国毒情形势报告》的统计数据,中国制造毒品犯罪的数量从2013年的773起降低到了2021年的272起,制毒犯罪的涉案毒品数量从2015年的79吨下降到了2021年的1.2吨。根据国家禁毒委公布的历年《中国毒情形势报告》,如表3所示,可见中国2013-2022年缴获毒品数量情况。
 
  然而,2018-2021年,全球缉获的甲基苯丙胺被确定为最终或中间目的地的主要国家集中在东亚、东南亚、中亚和北美等地。这说明,毒品市场是跨境流动的,治理毒品犯罪应当立足于全球视角。受供给量大幅减少等影响,三类常见毒品在2022年全国零售平均价较2021年大幅上升,海洛因1261.1元/克,同比上升31.6%;冰毒晶体1207元/克,同比上升37%;氯胺酮794元/克,同比上升67.7%。而阿富汗制造甲基苯丙胺的成本远低于东亚和东南亚,仅为东南亚的10%左右,如缅甸的甲基苯丙胺批发价为3000美元/千克,阿富汗则为280美元/千克。国内毒品市场日趋上涨的毒品价格和国外低价毒品的诱惑,将驱使部分毒品犯罪决策者实施毒品犯罪。
 
  2.应控制毒品市场供需均衡追求治理效益
 
  如图7所示,在不考虑毒品供给市场变化的情况下,若仅减少毒品的需求,控制需求曲线向左下方移动,而供给曲线不变,同一毒品价格P1所对应的毒品需求数量将从Q1下降至Q2,同时毒品市场的供需均衡点将从0点下降到0'点。此时,不论是均衡点的毒品价格,还是均衡点的需求数量,都呈下降趋势。而毒品的利润下降,能使部分潜在犯罪人放弃犯罪。若需求曲线保持不变,仅控制供给曲线向左移动,均衡点的毒品价格反而增长。所以,基于博弈论和供需理论等视角,控制毒品需求是比单纯控制毒品供给更有效的治理方式。
 
  此外,均衡点受供求弹性影响而变化。影响需求弹性的因素主要有需求替代品,替代品种类越多,需求弹性系数就越大。合成卡西酮是一类苯丙胺类兴奋剂,已作为摇头丸、可卡因和苯丙胺等毒品的替代品出现在葡萄牙毒品市场上。因为当A毒品价格迅速上升时,需求者就会转而寻找替代品,导致A毒品的需求出现大幅度波动(见图8)。根据研究样本情况和《2014年中国毒情形势报告》内容可知,B村及国内其他地区的制毒分子曾至少掌握了两种制毒方法:第一,从麻黄草中提取麻黄素,再由甲基苯丙胺通过结晶生成盐酸甲基苯丙胺;第二,直接购买化学合成的麻黄碱制备甲基苯丙胺。但由于我国加大对麻黄草和麻黄碱的管理力度,导致其价格上涨,犯罪分子为降低成本,使用其他原料(如苯基丙酮)替代麻黄碱化学合成毒品,从而逐渐摆脱对麻黄碱的依赖。近年,还有犯罪人寻求非列管化学品用于制毒。同理,可推知犯罪供给弹性。通过控制毒品犯罪分子的非法获利,可以有效控制供给弹性。因为这能减弱毒品供给能力,延长其反应时间,毒品供给能力下降意味其随毒品价格变化弹性减弱。
 
  三、研究启示:构建动态三层次
 
  (一)第一层——未然阶段:信息充分流转
 
  1.消除隐蔽:提升犯罪决策者对信息的接收能力
 
  第一,应重视行政法与刑法的配合衔接,以严密法网,弥补信息漏洞。提升犯罪决策者对信息接收能力的前提是,犯罪治理决策者需要扫清“信息障碍”。譬如,我国《禁毒法》第五十九条规定:“有下列行为之一,……尚不构成犯罪的,依法给予治安管理处罚:(一)走私、贩卖、运输、制造毒品的;……”而我国《刑法》第三百四十七条规定:“走私、贩卖、运输、制造毒品,无论数量多少,都应当追究刑事责任,予以刑事处罚。”如此立法设置,导致有观点认为我国《刑法》侵占了走私、贩卖、运输、制造毒品四类行为可不予刑事处罚而仅适用行政处罚的空间。即使《刑法》总则的“但书”条款为四类涉毒行为设置了出罪与定罪免刑的空间,但我国刑事司法依然未体现刑法的谦抑性原则,因为能够查实的前述四项涉毒行为无一例外都被定罪。此外,我国还有许多刑法前置法,如《治安管理处罚法》等。毒品犯罪立法应当贯彻“以事前预防为基础,以事后反应为补充的立法观念”,犯罪发生后的预防一般通过刑罚来实现,但对犯罪前的预防不可忽视前置法的作用。
 
  第二,禁毒教育是消解信息不对称最直接的方式,应当采取多种途径展开。一方面,在主导主体方面,政府机关应当协同社会组织开展禁毒教育活动。譬如,美国缉毒署、疾病预防控制中心、教育部、司法部等政府机构连同基金会、毒品科研机构等社会组织构建了“全政府—全社会”的毒品预防教育体系,制定了“无毒校园”、“无毒家庭”、“无毒社区”等计划。OlinOldeide等对挪威一个市镇进行个案研究,发现社会工作者可作为分散的城市中预防毒品的安全网结构。所以,可以鼓励社会工作者等群体参与禁毒宣传教育活动。另一方面,在教育方式方面,为提升潜在犯罪人对信息的接收能力,可将禁毒宣教融人民俗文化和当地习惯。如L市制作皮影戏等具有本地特色节目,既提升了群众对禁毒信息的接收能力,又增强了群众防毒意识;还可基于家庭道德文化建立起政府、家庭、学校、社会“四位一体”的协同禁毒教育体系。
 
  2.监督鉴别:使决策实施者做出“正向选择”
 
  第一,对权力运行进行全过程监督。我国常把监督重点放在违法违纪案件的查处上,忽视对决策者使用决策权的事前监督和滥用执行权的事中监督,导致惩治性的事后监督远多于事前和事中监督。在B村的毒品犯罪治理过程中,正是忽视了事前监督和事中监督,才导致少数国家工作人员出现“逆向选择”,为谋私利而实施犯罪。因此,应构建权力运行的全过程监督体系,尤其注重事前监督,让犯罪治理的决策权和执行权保持“正向选择”。
 
  第二、鉴别流通信息的真实性。在信息流转中,各方都可能使用虚假信息迷惑对方。犯罪治理决策实施者主要关注对自己身预期利益损害最小的信息,犯罪治理决策者在授予实施者权限时,后者会获得自主行动的空间和“隐蔽信息”,导致其选择“选择性落实”、“策略性应付”与“针对性迎合”等策略反馈虚假信息,这将影响治理的真实效率。
 
  (二)第二层——在然阶段:控制犯罪发生场域范围
 
  1.把控时空因素
 
  (1)堵截境外来毒与打击境内制毒
 
  第一,加大查缉力度,提升国际禁毒合作水平,协同堵截境外来毒。甲基苯丙胺可以在小型实验室或者超级实验室生产,二者区别在于产品产量及嵌入贩运网络的方式。由于G省毒品走私问题依旧严峻,毒品走私进人G省境内后有三个去向:本地消费、向内地各省疏散销售、出口到我国港澳地区和其他国家。应将“堵源截流”作为打击毒品走私的重中之重,把毒品堵截在境外,以减少国内毒品供给。
 
  第二,完善禁毒情报研判平台,注重区域协作治理,合力打击国内制毒。虽经打击治理后,国内制毒态势有所缓解,但毒品犯罪问题仍危害G省、辐射周边、影响全国。面对制毒场所外移新形势,应完善禁毒情报研判平台:加强各地区部门间的信息共享,形成禁毒部门侦查,其他部门协同治理的模式。
 
  (2)毒品犯罪的情境预防治理
 
  情境犯罪学认为所有人都有可能犯罪,犯罪人与正常人只在犯罪机会方面存在区别,主张最好的犯罪预防就是不给犯罪提供有利机会,所以犯罪预防要从事后的处罚转向事前犯罪环境的改变。情境犯罪学为预防犯罪提供了具备可行性的操作方法,从增加犯罪成本、增加犯罪难度、降低犯罪收益等角度出发,促使“预防刑法观”理念得到进一步深化,提升了犯罪治理的针对性。
 
  2.弥补社会控制疏漏
 
  (1)正式社会控制疏漏
 
  第一,减少犯罪黑数。犯罪黑数是犯罪统计数与实际发生数之间的差额,无被害人的犯罪大多并未立案,如贩卖毒品、容留他人吸毒等犯罪的发生比较隐蔽,若无人报案,几乎不可能被及时立案。虽然犯罪黑数的存在是不可避免的,但巨大犯罪黑数的存在,增强了潜在犯罪人的侥幸心理,使犯罪治理策略的实施效果大打折扣。所以,为减少犯罪黑数,应提高公安机关侦查毒品犯罪的能力,提升破案率。
 
  第二,弥补司法漏洞。犯罪治理决策实施者与犯罪决策者双方极易在利益的驱动下形成非法互利关系,应提高职务犯罪等的查处力。具体方式可分为强化内部控制力和外部控制力两大方面,前者包括加强司法机关等易发领域内国家工作人员的廉政教育,使廉政理念内化于心,外化于行;后者主要包括
 
  提升侦查机关的侦破能力。从司法实践看,犯罪的手段越来越隐蔽,侦查机关在侦查手段等方面同反腐形势发展不能相适应,为此需与其他部门协同侦查。
 
  (2)非正式社会控制疏漏
 
  立足于本土情境,弥补基层自治的漏洞。B村的宗族文化曾对乡村基层治理起消极作用,但当地现今顺应本土情境将禁毒工作与基层自治相结合,最终突破了治理困境。具体而言,可以鼓励政治信念坚定的当地权威参与选举,进人村委班子后,发挥其在基层治理的话语权作用,提升禁毒工作效率,普及禁毒法律政策知识。
 
  (三)第三层——已然阶段:以控需为导向的治理策略
 
  毋庸置疑,刑罚为抑制毒品供给市场发挥了重要作用。而博弈分析结果发现,在事后治理的已然阶段,控需是比控制供给更有效的毒品犯罪治理方式。有学者认为应将吸毒行为入刑以威慑毒品滥用者,但这无法根治毒品滥用的问题,因为威对萎缩毒品市场作用有限。吸毒者之所以被毒品控制,根本原因在于毒品对吸毒者心理和生理的束缚,他们选择吸毒往往并非基于自由意志。
 
  1.减少毒品市场需求:以非刑罚手段抑制毒品滥用
 
  (1)基于本土情境探索戒毒模式
 
  易制毒化学品管制对打击冰毒生产影响有限,因为制毒者能迅速调整并使用替代方法来制造冰毒。所以充分利用国家、社会和民间的力量与方式探索适合本十土的戒毒方案是必要的。如J镇已建立B村、K村和Y村社区戒毒(康复)工作站共3个,现正在接受社区戒毒社区康复人员共52人,到位率达100%。还如凉山彝族“虎日”民间戒毒模式,“该模式以家族仪式为契机,激活了彝人源自家族组织、信仰仪式和伦理道德等文化因素,激发出克服毒品成瘾性的毅力,有效提高了地方人民的戒毒成功率”。
 
  (2)创新医疗手段抑制毒品需求
 
  迄今为止,各国研究人员为去除吸毒者的毒瘾进行了长期研究。在鸦片战争时期,以林则徐为代表的爱国者发明了“扶正丸”等中药治疗鸦片毒瘾:随着现代医学发展,研究发现恢复神经功能方面的药物对毒瘾治疗有效。医疗领域的创新为治疗毒瘾问题提供了有效途径,而在治理阿片类药物滥用危机中,可以考虑的包括安全的药物消费场所、匿名药物检查服务、更新的药物分发政策等。
 
  (3)鼓励吸毒人群回归正常生活
 
  创造适合吸毒人群回归正常工作生活的环境。“教育、就业、人际支持、犯罪惩处、道德标签和自我认同等层面的社会排斥成为吸毒人员难以回归社会的障碍”,而回归社会失败的吸毒人员具有较大复吸风险,陷入“吸毒一戒毒”的恶性循环中,其至可能造成“以贩养吸”和“以制养吸”的不利局面。为维护戒毒人员的合法权利,政府部门应完善就业安置等福利制度安排,保证其在就业等方面不受歧视。
 
  2.控制毒品供需弹性:减少毒品替代品与加强国际反洗钱合作
 
  (1)控制需求弹性:实施药物替代治疗与加强对新精神活性物质的管控
 
  第一,开展药物替代治疗。我国毒品需求市场弹性较大,替代品繁多,主要可分为传统毒品和新型毒品。譬如,为减少毒品滥用者寻找替代品的概率,可运用“美沙酮维持疗法”。研究证实,美沙酮维持疗法能减少毒品滥用者对海洛因等毒品的使用量,可在一定程度缓解对毒品的依赖。尽管替代疗法无法彻底消除毒品依赖性,但为控制毒品市场的需求弹性提供了途径。
 
  第二,严格管控新精神活性物质。在严厉打击传统毒品与新型毒品的态势下,毒品的价格不断升高,而相对容易获得的NPS常成为毒品供给的替代品。与传统毒品相较,NPS具有更新换代更快、法律地位模糊、规避毒理学测试、采用全球互联网营销模式等特点,有国外学者对6个欧亚国家的124名吸毒者(含无非法药物使用史的人)进行访谈得知,由于传统毒品的购买成本、获取难度及法律风险较高,NPS已成为其中许多人的首选。比利时联邦研究中心的学者认为,消费NPS的动机除了外部原因(如毒品价格和毒品易得性等),还存在个人原因(如为满足个人好奇心等)。要解决该危机,国际社会需要加快列管步伐,推动治理模式创新。
 
  (2)控制供给弹性:开展国际多边合作打击涉毒洗钱犯罪
 
  若打击毒品供给市场属于“截源”,那么反洗钱则是对毒品市场的“截利”。“洗钱”作为一个法律概念始现于1986年美国《洗钱控制法》,该法案颁布两年后的《联合国禁毒公约》则开创了国际反洗钱合作的先例。从毒品市场的流通环节看,对各类毒品犯罪进行“截利”是比单纯“截源”更加系统化、更具动态化的治理方式。如图9所示,毒品的生产、流通、消费和再生产环节分别对应了毒资的集中、分流、分散到回笼的动态变化,对各环节的毒品犯罪进行“截利”,可减少毒赃、毒资和其他毒品犯罪所得进入毒品犯罪循环的机会,从而间接影响毒品市场的供给弹性。但是,现今国际反洗钱合作存在“国际标准和反洗钱区域需求不匹配”等问题。所以,为统一标准和原则应对涉毒跨境洗钱犯罪,需统一国际与区域的金融监管标准,减小各地反洗钱的制度差异,构建高效的反洗钱交流合作平台,进一步完善涉毒反洗钱措施。
 
  综上,博弈论视角下毒品犯罪动态治理体现在三个层次上:未然、在然和已然。未然阶段,即主要运用宣传教育等方式防止犯罪发生,反映出事前早期治理能力;在然阶段,即通过控制犯罪场的构成要素和犯罪场域范围防止客观犯罪行为的发生,避免让潜在犯罪人成为犯罪人,反映出事中治理策略的应变能力;已然阶段,即打击和威惩罚已经发生的犯罪,改造犯罪者并预防其重新犯罪,反映了事后治理中矫正制度的状况和促进犯罪人回归社会的情况。治理中全过程动态管控,各阶段衔接配合,层次之间目标清晰,方可构建动态环境中三层次的毒品犯罪综合治理体系,如图10所示。
 
  结语
 
  不论是“刑事一体化”理念、“刑法的刑事政策化”思想,还是“预防刑法”理论,都阐明通过刑罚参与犯罪治理具有局限性,同时承认具备跨学科属性的犯罪学对刑法学和治理政策的积极意义。通过跨学科研究,借鉴其他学科理论,能丰富立法和司法在刑事政策上的根据。毒品犯罪依赖毒品市场的生产供应、销售、消费、再生产等链条进行,其中蕴含了丰富的经济学色彩。基于博弈论视角,博弈主体、博弈规则、博弈结果和博弈效益四要素勾勒出了博弈形成阶段、博弈决策阶段、博弈终局阶段犯罪治理三层次体系,并在对应的未然、在然和已然阶段提出具有针对性的措施,从而使博弈主体能在各层次发生动态合作或动态对抗,获得收益“均衡”。这为毒品犯罪综合治理提供了独特的研究框架。
 
  但是,人的认识能力和实践能力存在局限性,基于各种经济学理论假设的博弈论对复杂社会生活进行简化分析的研究,仅为抛砖引玉。如今阿片类药物滥用和NPS滥用危机愈演愈烈,毒品犯罪治理面临的挑战愈发严峻,还需根据国情和毒品犯罪变化态势总结经验,不断提升毒品问题治理能力和水平,构建中国特色毒品犯罪治理体系。
[责任编辑]杜新忠
杜新忠戒毒网--戒毒门户 权威媒体