转自清华“水木社区”的《发烧电源线盲听试验》

血还在烧 · 发表于 2016-4-25 13:41

本帖最后由血还在烧于 2016-4-25 14:30 编辑

话说月前清华的兄弟就微信发给我这个“盲听试验”的“约战”贴，想不到还真成行了！

其实这帮人是否闲的蛋疼不重要，结果如何也不重要，不过他们以严谨治学的精神来对待发烧的态度个人还是很赞赏滴

原文链接：http://www.newsmth.net/nForum/#!article/HIFI/164129

发信人: i925XE (电源宅|金坷垃,金坷垃~), 信区: HIFI
标题: HiFi版发烧电源线盲听试验总结
发信站: 水木社区 (Sat Apr 23 23:33:12 2016), 站内 [累计积分奖励: 0/100]

2016年4月23日，HiFi版网友CanonFans主持了一场针对发烧电源线的盲听测试。测试场所选在莲花桥附近的某个带有轻度声学装修的试听室。受试者是CanonFans本人（受试者2号），以及另一位HiFi发烧友（受试者1号）。测试的议题是——

“用两条不同的电源线给前级供电，受试者能否听出用的电源线是哪条？”

————————
测试内容摘要：
受试者1号对比了2万元电源线和1万元电源线的区别
受试者2号对比了2万元电源线和10元随机电源线的区别
测试序列是01111100001001101001
通过测试的条件是20次测试里至少17次答对是哪条线。

按照实验进行的时间顺序，受试者1号的测试序列是01111100001001101001，0代表2万元线，1代表1万元线。
受试者1号的回答是01111100100010010101，正确率60%，错误8个，未通过测试。

按照实验进行的时间顺序，受试者2号的测试序列是10000100110100101111，0代表2万元线，1代表10元线。
受试者2号的回答是10001000101011101111，正确率65%，错误7个，未通过测试。

受试者2号和1号的实验序列产生差异的原因是受试者2号的测试从实验序列第6轮开始做，做到第20轮以后，再回来补做的第1-5轮。

对测试结果的数学解读，用大白话来表述就是——
我们不能以99%（实际上是95%）的把握去断言，两位受试者在试听时并不是在抛硬币。

小结完毕，以下是正文。
————————
先说一下为什么要做盲听实验。电源线用于音响设备供电，对于音质的影响机理并不明确，但是的确有一批发烧友认为他们在更换电源线后感受到了音质提升。为了将“音质提升”当中的安慰剂效应排除出去，用盲测是最有说服力的。

测试视听室的内景（图片1）

图中地板上是两台后级，两侧的黑色喇叭用于播放测试音乐

受试者聆听的状态（图片2）

放置测试用器材的架子，用布帘遮住，电源线隐藏在架子后方（图片3）

使用的器材组合为
解码器+音源：dCS解码器+dCS CD机等，dCS Vivaldi旗舰套装
前级放大器：Mola-Mola Makua前级（被试电源线就给它供电）
后级放大器：Analog Domain后级
音箱：Kharma Exquisite Midi EXQ MD音箱
（按照总代的淘宝价加起来，全套价格得上百万了？）

受试者1号测试的碟好像有骷髅舞曲
受试者2号测试的碟是陈洁仪的《等了又等》
格式都是SACD。

测试的A线，Kharma Enigma Signature Limited Edition，成交价在2万元左右（图片4）

测试的B线，Stealth Dream V10，长2米，成交价在1万元左右（图片5）

在受试者2的测试中，作为B线代替Stealth线用来和Kharma做对照的普通美标接头2米长机线，从Chord解码器的包装盒里抠出来的，没照照片，就和普通电脑用的电源线外观差不多，美标3极插头。

被试的Kharma电源线接在前级后面的样子（图片6）

————————
下面是对测试流程的介绍。
测试的性质是单盲测试，轮次为20轮。每轮将随机地用A线或者B线中的一条给系统中的前级供电，由受试者播放自己指定的音乐，试听一段以后判断前级是由A线还是B线供电。20次完成后，能答对17次或17次以上的，视为受试者通过了测试，即承认受试者能听出A线和B线为前级供电的声音差异。未能答对17次，则视为未通过测试。
20轮分别使用哪种电源线，最初商定的方案是由见证者现场抛硬币决定，试抛了几次发现正反面的分布不太均衡，于是改用在线随机数发生器（http://www.99cankao.com/numbers/random-number-generator.php）生成了一组20位的01序列，0代表使用A线，1代表使用B线，用于测试。随机序列是：01111100001001101001。巧合的是20位的随机序列正好0、1各半，这也是我们期望的。操作者（也就是我）在每一轮测试开始时才从见证者处得知这一轮要采用哪根线。
更换线材时操作者被布帘遮挡，在操作时尽量避免通过时长、声音、动作等将使用了哪条线的信息泄露给外部。
每一轮测试进行之前，受试者均有权利试听由A线和/或者B线供电播放的声音。如果受试者有充分的自信，可以不试听A/B线的声音直接进入这一轮的测试环节。

————————
测试结果：
先说结论，正确答案是：
01111100001001101001
受试者1号的作答是：
01111100100010010101，正确率60%，错误8个，未通过测试。
也就是说不能证明1号选手听出了Kharma和Stealth线的差异。
受试者2号的作答是：
01111100010001010111，正确率65%，错误7个，未通过测试。
也就是说不能证明2号选手听出了Kharma和解码器自带电源线的差异。

通过随机数发生器生成的测试序列，也是操作者接线的依据（图片7）

由随机数序列得到的测试序列（图片8）

受试者1号（左）和2号（右）的答题纸（图片9）

————————
对测试结果的数学解读：

首先由Azzuro解释一下为什么要设置20次样本、17次通过的测试标准。

发信人: Azzuro (水果黑), 信区: HIFI
标题: Re: HiFi版发烧电源线盲听试验总结
发信站: 水木社区 (Sun Apr 24 14:51:45 2016), 站内

20次独立实验下，如果要排除的分布的期望值不接近0也不接近1，则二项分布可以近似为高斯分布
要排除的是无区别，也就是0.5的正确／错误率，所以符合上述条件
这时候，如果无分别，那么20次独立实验中，出现猜对／猜错的次数服从N(10, 5)这个分布，其中10是均值，5是方差，2.24就是标准偏差，所以10+3*2.24或者10-3*2.24就是3倍标准偏差以外的显著性，可以p<0.01的显著性排除假设的“无区别”这个假设
也就是说，正确超过17次或者小于3次，就达到3倍标准偏差的区分度了

样本小于20的话，没办法近似用高斯近似，可以画条曲线来判断，直接说结论，应该是10次中猜中或错9次，才有3sigma的显著性

//以上为引言

用大白话说，假如受试者完全听不出被测线是A或者B的哪一条，那么他回答的正确/错误率应该是0.5——和抛硬币一样。那么假如测试结果20次里对或者错的次数达到17次，就可以说测试者有超过99%的几率不是抛硬币，而是猜对几率和猜错几率不相等。假如只看时间上连续10次的结果里，对或者错的次数达到9次，就可以说测试者有超过99%的几率不是在抛硬币了。

所以用大白话来总结这次的结果，就是——

我们不能以九成九的把握去断言，两位受试者在试听时并不是在抛硬币。
·· ··

更进一步讲，20次中13次的结果翻译过来，就是——
有不到七成的可能性，受试者不是在瞎蒙；有三成多的可能性受试者就是在瞎蒙。

————————
测试流水账：

受试者1号和受试者2号在进入首轮测试前分别进行了几分钟的热身，充分试听了Kharma线和Stealth线的声音。
受试者1号进行了7次测试后，进入休息环节，由受试者2号进行热身和测试。
受试者2号进行5轮测试后进入休息，要求将他的测试项目从猜Kharma线（A线）和Stealth线更改为A线对比机线。所以受试者2号从第6轮到第20轮试听的B线都用机线代替，然后第1轮到第5轮进行A线和机线的对比测试。
接着受试者1号试听了A线与B线后进行了第6轮至第14轮的测试，而后进入休息。中间可能插入了几次试听A线或者B线，我记不清了。
接着受试者2号试听了A线与B线后进行了第6轮至第8轮的测试，再次试听A线与B线后，进行了第9至12轮测试，进入休息。
接着受试者1号试听了A线与B线后完成了第15轮至第20轮的测试。
受试者2号随后进入试听，完成了第13轮至第20轮的测试（这8轮里有没有再插入试听，我记不清楚了）。随后受试者2号更换了测试用的曲目，完成了第1轮至第5轮由Kharma线对比机线的测试。

一点花絮，受试者1号在试听过程中对一耳朵听出来的结果进行了7处划改，其中6处改对，1处改错。受试者2号除了前5次（要划掉原先的作答，改成第二次测试的作答）以外只进行了1处划改，结果1处改错。热身轮次里受试者们都明确表示听出了机线和Kharma线的差异。

————————
测试中不足的环节：
听音测试应当尽可能减少环境噪音，测试当中周围人的交头接耳即使声音很小，仍然对受试者在试听和测试环节的发挥有或多或少的影响，应该设置交谈专用的房间。
另外受试者反馈说同一段音乐听了很多次以后对声音特点的记忆反而模糊了，可能记反了A和B，这是事前没有想到的，应该建议受试者每听几次以后更换一段测试音乐，重新进行热身试听。
受试者还反馈说试听时音量开得比较大，听的时间长了耳朵会疲劳，对此我认为以后的测试方案要注重测试者休息时隔绝噪音，最好有专门的休息场所或者戴耳机休息。
如果除了想检验受试者是否能听出差异，还想以较大的把握判断受试者是不是在瞎蒙，20次测试的样本数是不够的，需要增加到40次、50次乃至100次为宜，考虑到体力因素，需要将测试拆到多日进行。
————————
结语：
根据我们的测试规则，两位受试者均未通过测试。无论是受试者1号试听2万元Kharma线对比1万元Stealth线，还是受试者2号试听2万元线对比10元随机线，都没有通过测试证明其听出了差异。
每个看到结果的人都可以保留自己的理解，希望参与者们一个下午的辛劳能够为烧友们未来的消费决策提供一些参考。
从我个人的角度，我衷心希望每个对于电源线、信号线、滤波器、插线板之类拿不准主意的烧友能找个时机，通过盲测评判一下自己该不该花这个钱，也希望我们的盲测试验的设计能帮到大家。
感谢两位受试者和所有参与这次测试的志愿者的辛勤付出，也感谢试听场地和器材的提供者（来自清华材料的师兄）。最后想对开出过赌注却最终怂了的几位网友说一声，你们亏大了，“You should be ashamed”。（图片10）

zjize · 发表于 2016-4-25 16:28

我有试听过电源线，翻来复去的听，细仔的比较。我的概念是：有差别，但极为微弱。微弱到哪怕知道的情况下，也要非常仔细才可能对比出来区别。一旦盲听，则完全不能区别。
这种实验网上已有多个，不仅是电源线，也有信号线，甚至有音箱和功放，而且实验过程也应该是比较科学的。实验表明，一台几千的功放和几万的功放，盲听没有区别的。然后有位家伙就真的买了那台低价的，然后后悔了很久。因为他事后发现那台功放根本不好，跟好的那台差别巨大。但盲听的结果却是真的显示结果不是显性的。

zjize · 发表于 2016-4-25 16:36

我也做过一些其它对比，最简单的就是用耳机。两只差异巨大的耳机多次切换听同一首歌后，我感觉自己都晕头了，完全没法区别差异。需要休息非常长的时间才能恢复正常状态。
所以我现在比较耳机的时候，一种音乐，切换一两次就得休息，起码一个小时左右，才会再次比较下一种音乐。否则我感觉差别会明显变小。
如果这样听20次，我估计，HD800和DT235我估计都要听不出区别了。没法，听力疲劳早战胜了这个差距了。就算没有这么吓人，但也差不了多少了。

zjize · 发表于 2016-4-25 17:00

在学习实验设计课程时，举的例子常常时用药效作为例子。每一种药物要证明其有效，需要数千个样本，一组使用，一组不用，一组仅使用安慰剂（即假药），用数年的时间，方可以验证药物的有效与否。而有效率如果达到80%以上时，就可以叫特效药了。

QQ上有一个游戏，叫“大家来找蹉”，对比两幅近似的图，找出其中不同的5处。很多图，我一出都找不出来。但这是否意味着这两幅图是一模一样的呢？而且这还是直接把两幅图做对比的情况下，如果不直接对比，只允许看一幅一段时间，再看另一幅图来找不同点。这个能找出不同点的难度，估计没几人敢去挑战吧。这和对比两段相似音乐找不同点而言，难度还要低些。因为人对图像的记忆能力要强得多。

实际上，上面测试中，后一组正确率已经达到了65%，表明猜中的机会算不错的了。这种实验结果我见过多个数据，某些实验者达到了70%到80%的正确率，虽然仍然有可能是蒙对的，但概率上来讲已经不大了。因为我看过其它人结果，大多都是在50%-60%之间，低于40%的几乎没有。都加在一起的正确率仍然是超过50%很多的。
就纯这个结果而言，我认为差别仍然是存在的，只不过，不太显著而已。不然，为什么两人达到了60%和65%这样的正确率。而不是非常接近50%？毕竟抽样数总体已经达到了40次之多了。

lqdxy · 发表于 2016-4-25 17:49

我最早开始玩线材是从1996年开始，距今也有20年了，期间器材升级了很多次，线材也在不断升级更换，感觉玩线材比搭配器材还要难，有时一根线材可以改变一套系统的声音，这个并非危言耸听，是经验的积累，自己的体会。要搭配出一套声音平衡流畅，音色优美的系统，除了大件外，线材也是很重要的一环！

zjize · 发表于 2016-4-25 23:04

lqdxy 发表于 2016-4-25 17:49
我最早开始玩线材是从1996年开始，距今也有20年了，期间器材升级了很多次，线材也在不断升级更换，感觉玩线 ...

同意这点！只不过，某些JS或代理过份夸大的线材的作用了。在中低端器材上，线材就算有作用，也有限得很。但一旦到了高端，其实还是可以轻松区分的。
只不过，盲听真是个事，那个差距要大到非常大的程度才行。

dicaga · 发表于 2016-7-28 06:18

音响线材到底是不是玄学？

lfwei1229 · 发表于 2016-10-8 16:49

从数据分析，前8次内两位测试者达到了100%正确，已说明区别是明显的。时间太长，谁都受不了

		自动登录	找回密码
密码			成为基民