2019年10月通讯

发布通过&申请下时事通讯

Ben Pace总结了第二轮人工智能对齐撰写每日文章。Zettelkasten方法:MIRI研究员Abram De金宝博娱乐mski描述了一个对他的研究生产力有很大积极影响的笔记记录系统。金宝博官方威尔·麦卡斯基尔写了一个详细的批判功能决策理论;亚伯兰·德姆斯基(1,2)和马修·格雷夫斯在评论中回应。新闻和…阅读更多»

2019年9月通讯

发布通过&申请下时事通讯

我们运行了一个非常成功的MIRI夏季研究员项目,其中包括一天参与者公开写下他们对各种AI安全话题的想法。参见本·佩斯系列文章中的第一篇。写作日的几个亮点:阿黛尔·洛佩兹的优化来源;丹尼尔·科科塔杰的软起飞仍然可以带来决定性的战略优势和…阅读更多»

2019年8月通讯

发布通过&申请下时事通讯

MIRI研究助理斯图尔特·金宝博娱乐阿姆斯特朗为向甲骨文AI提问的好问题提供1000美元。Stuart最近的AI安全帖子:漠不关心:多重变化,多重代理;理论间效用比较:实例将公用事业作为支付意愿正常化;部分偏好被重新审视。MIRI的金宝博娱乐研究员Buck Shlegeris整理了一份快速而非正式的人工智能安全阅读…阅读更多»

2019年7月简报

发布通过&申请下时事通讯

Hubinger等人的“先进机器学习系统中学习优化的风险”是我们对齐问题的新核心资源之一,现在可以在arXiv AI对齐论坛和LessWrong上使用。金宝博官方其他消息,我们收到了来自Vitalik Buterin的价值230910美元的以太坊捐赠,他是以太坊的发明者和联合创始人,现在是我们的第三大…阅读更多»

新论文:“学习优化带来的风险”

发布通过&申请下论文

Evan Hubinger, Chris van Merwijk, Vladimir Mikulik, Joar Skalse和Scott Garrabrant发表了一篇新论文:“高级机器学习系统中学习优化的风险。金宝博官方这篇论文的摘要:我们分析了当一个学习模型(比如一个神经网络)本身是一个优化器时发生的学习优化类型——我们提到的这种情况……阅读更多»

2019年6月通讯

发布通过&申请下时事通讯

Evan Hubinger, Chris van Merwijk弗拉基米尔•Mikulik Joar Skalse,和斯科特Garrabrant已经发布了两个(五)第一篇文章“mesa-optimization”:这个序列的目标是分析的学习优化的类型发生在学习模型(如神经网络)本身就是一个优化器情况我们称之为……阅读更多»

2019年5月通讯

发布通过&申请下时事通讯

更新了MIRI研究员Vanessa Kosoy在本周ICLR金宝博娱乐 SafeML研讨会上发表的一篇新论文:“授权强化学习:在一点帮助下学会避免陷阱。”New research posts: Learning "Known" Information When the Information is Not Actually Known; Defeating Goodhart and the "Closest Unblocked Strategy" Problem; Reinforcement Learning with Imperceptible Rewards The Long-Term Future Fund has announced twenty-three new…阅读更多»

118bet金博宝app

发布通过&申请下论文

MIRI的金宝博娱乐研究助理Vanessa Kosoy写了一篇新的论文,“委派强化学习:在一点帮助下学会避免陷阱。”Kosoy将在两周后的ICLR 2019 SafeML研讨会上展示这篇论文。其摘要是:最著名的强化学习的后悔界限要么是情景性的,要么是假设一个没有陷阱的环境…118bet金博宝app