我们2018年的募款活动正在进行中!!

新论文:“功能决策理论””

||论文

功能决策理论

米里高级研究员以利以谢Y金宝博娱乐udkowsky和执行董事内特苏亚雷斯对决策理论新介绍性的论文:“”功能决策理论:一种新的工具理性理论”。”

文摘:

本文描述和激励理论被称为一个新的决定功能决策理论(FDT),不同于因果决策理论和证据决策理论。

功能决策理论家认为,行动的规范原则是把自己的决定当作回答问题的数学函数的输出,”这个函数的输出会产生最好的结果吗?”坚持这一原则提供了许多好处,数组中包括的能力最大化财富的传统决策理论和博弈论的问题,CDT,美国表现不佳。使用一个简单的和一致的决策规则,功能决定论者(例如)实现效用比CDT纽科姆的问题,比美国更实用的吸烟损伤问题,和效用比帕菲特的搭便车问题。

在这篇文章中,我们定义FDT,探索许多不同的决策问题的处方,CDT和美国进行比较,并给哲学理由FDT作为规范性决策理论。

我们之前的介绍性的论文FDT,””欺骗死亡在大马士革,”专注于比较CDT的FDT的性能,和美国相当高级。Yudkowsky和苏亚雷斯的新论文提出一个更大的关注FDT的力学和动机,“功能决策理论”最完整的独立的理论介绍。1

内容:

1。概述。

2.纽科姆的问题,吸烟损害的问题。的效用,传统美国优于CDT纽科姆的问题,而表现不佳的CDT吸烟损伤问题。CDT和美国因此出现unsastisfactory期望效用理论,和两者之间的辩论仍然陷入僵局。FDT,然而,提供了一个优雅的标准匹配美国的表现在前的困境,同时匹配CDT的表现在后者的困境。

3.虚拟语气的依赖。FDT可以被认为是一个修改的CDT的依赖,不是因果依赖关系,但在一个更广泛的一类虚拟语气包含作为特殊情况的因果依赖的依赖关系。

4.帕菲特的搭便车旅行者。FDT的小说性质可以更容易看到帕菲特的《银河系漫游指南》的问题,CDT和美国表现FDT。Yudkowsky和苏亚雷斯注意三点支持FDT传统理论:从原来一个论点,一个论点从信息价值,从效用和论证。

5.形式化,CDT,和FDT。精密借给声称给定决策理论规定一个给定的行动,Yudkowsky和苏亚雷斯定义每个理论算法实现。

6。比较这三个决定算法的行为。Yudkowsky然后Soares重温纽科姆的问题,吸烟损伤问题,帕菲特的搭便车问题,算法。

7.诊断:美国东部时间条件反设事实。核心问题与美国和CDT是假设的场景,他们认为是畸形的。美国通过调节联合概率分布,当相关性是虚假时,这会导致问题。

8。诊断CDT:不可能的干预措施。CDT,与此同时,作品通过考虑严格因果反设事实,导致问题时,错误地将不可避免的相关性,仿佛它们是可以打破的。

9:全球视角。FDT counterpossible推理的形式允许代理方面更广泛的现实世界的依赖比CDT,而不包括美国的虚假的依赖性。我们可以理解FDT反映了”全球视角”决策理论的代理应该寻求最理想的决定类型,而不是最理想的决定令牌。

10.结论。

我们使用术语“”功能决策理论”因为FDT调用代理决策理论可以被认为是实现确定的功能目标和观测历史行动。2我们可以清晰地看到这个功能纽科姆的问题,一个FDT agent-let叫她霏欧纳,在本文的原因如下:

ω知道这个决定我将到达率计算相同的决策函数我在相同的输入,和使用该函数的输出决定有多少箱子来填补。假设,然后,我实现输出的决策函数一盒。”相同的决策函数,实现ω,然后也必须输出”一盒。”在这种情况下,ω将填补不透明的盒子里,我会得到它的内容。(+ 1美元,000年,000.)

或假设,而不是我带两箱。在这种情况下,我的决策函数输出”两盒,”欧米茄将不透明的盒子空,我会得到两个框的内容。(+ 1美元,000.)

第一种方案具有较高的期望效用;因此我决定功能”在此输出一盒。””

与CDT代理限制自己纯粹的因果依赖关系,菲奥娜的决策能够考虑ω的行动之间的依赖关系和她的推理过程本身。因此,菲奥纳会比CDT代理商拿到更多的钱。

与此同时,FDT避免标准美国遇到陷阱,例如,吸烟损伤问题。吸烟损害问题有一些特点,比如潜在的代理来吸引“逗防御”叫做埃勒里;但是我们可以用XOR勒索问题,逗防御在哪里没有帮助美国。

XOR勒索问题,代理人听到谣言,他们的房子已经被白蚁出没,1美元的修理费,000年,000.第二天,代理收到一封来自可信的预测ω住:

我知道你是否有白蚁,我寄给你的这封信敌我识别一个以下是正确的:(I)的传言是假的,你要付我1美元,000收到这封信;或(ii)的谣言是真的,你不会支付我收到这封信。

在这个困境,美国代理支付,推理学习,它将是坏消息,他们中的白蚁尽管他们termite-riddenness无关,有原因地或否则,他们是否支付。

相比之下,菲奥娜FDT代理原因以类似的方式她如何在纽科姆的问题:

因为ω决定发送这封信是基于可靠的预测是否我会支付,ω,我都必须计算相同的决策函数。假设,然后,我的决定函数输出”不支付”输入“信。”的情况下我有白蚁,欧米茄将寄给我这封信,我不会支付(−1美元,000年,000);而如果我不有白蚁,欧米茄不会寄信。−0美元)。

另一方面,假设我的决策函数输出”支付”输入“信。”然后,如果我有白蚁,欧米茄没有寄信。−1美元,000年,000),如果我没有白蚁,ω发送这封信和我(−1美元,000)。

我决定函数确定我有条件地工资和ω是否有条件地发送一封信。但白蚁不是预测我,没有计算我的决策函数。如果我决定函数的输出是“工资,”这并没有改变白蚁的行为和对我没有好处;所以我不付钱。

与美国代理,菲奥娜正确考虑到支付不会增加她的效用XOR勒索困境;与CDT剂不同,菲奥娜one-boxing考虑增加她的效用在纽科姆的问题。

FDT,然后,提供了一个优雅的替代传统的理论,同时向我们提供一种更简单和更期望效用最大化的一般法则,在实践中,以及原则上更令人满意的理性决策的哲学解释。

更多的讨论FDT,我建议””决定让糟糕的结果不一致,”谈话探索反直觉的事实,以决定采取何种方法输出,决策理论代理必须考虑其确定性决策函数输出假设的场景比实际上输出什么其他的东西。3.

注册获取新的米里技术的结果

得到通知每当一个新的技术论文发表。


  1. ”功能决策理论”最初起草之前””欺骗死亡在大马士革,”大大延长之前我们收到了各种哲学社区的反馈。”在大马士革欺骗死亡由从早期草稿中剪下的材料生产;其他减少材料包括的讨论proof-based决策理论,和一些死在大马士革变体离开在切割室地板上不必要的残忍CDT。
  2. 在这种背景下,覆盖混合策略我们可以假设一个感官输入代理是一个随机的数字。
  3. 代理必须考虑的许多假设在内部是不一致的:确定性函数在给定输入上只有一个可能的输出,但是代理必须的决定是基于期望效用的不同”可能的”行动,以选择最好的行动。例如,纽科姆的问题,FDT和美国代理人必须评估个盒子的期望效用以衡量他们的选择和到达他们的最终决定,即使这样的代理人为双箱代理是不一致的;同样地,CDT必须评估可能的期望效用假设one-boxes CDT代理。

    尽管在理论上了解甚少,这种counterpossible推理在实践中似乎是完全可行的。即使一个错误的猜想经典地暗示所有的命题,数学家通常原因以一种有意义和重要的方式与猜想假设的场景有不同的真实值。如何最好地代表counterpossible推理的问题在一个正式的设置,然而,仍然没有解决。