A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGS

本文是阅读 ICLR 会议论文 "A SIMPLE BUT TOUGH-TO-BEAT BASELINE FOR SENTENCE EMBEDDINGS" 所作笔记。

论文 GitHub:https://github.com/PrincetonML/SIF

Abstract

本文提出了一种基于无监督学习的 Sentence Embedding 方法,其效果超过了目前(截止论文发表)主流的 Sentence Embedding 方法。流程如下:

  1. 计算 Word Embedding ,通过对无标签的语料库;
  2. 用加权词向量来表征一个句子;
  3. 用 PCA/SVD 来改善它们

融合NILM的直接负荷控制安全机制研究

摘要

采取一种应用于 AMI 的具有隐私保护功能的可恢复数据安全聚合方案。

利用同态加密聚合方式保证用户用电数据的安全性,利用一种合适的编码机制保证用户用电数据的可恢复性;

针对用户对直接负荷控制指令的可靠性和完整性的要求,利用 ESAM 芯片进行源认证,保证指令在传输过程中不被篡改;

针对电力公司对用户可信度的要求,利用非侵入式负荷监测技术实现对用户可信度的验证,帮助电力公司核实用户正确响应电网直接负荷控制需求,简化了繁琐的用户可信度证明过程。

基于监督学习的非侵入式负荷监测算法比较

摘要

建立基于多层感知器( MLP) 神经网络、 k-近邻算法、逻辑回归、支持向量机的 4 种 NILM 分类模型,利用 BLUED 数据库对 4 种分类器进行训练和测试,对比分析其在识别精度、训练时间、识别 速度和抗噪能力方面的表现,并对其在家庭负荷识别中的应用效果进行对比研究。

结果表明, 4 种分类器中 MLP 神经网络具有总体最优的分类效果和计算性能,更适用于家庭用户负荷监测。

基于NILM技术的家庭用户精确负荷建模方法

摘要

本文提出了一种基于非侵入式负荷监测(NILM)技术的家庭用户精确负荷建模方法。

该方法应用 NILM 技术对家庭主要设备负荷特性的提取,然后通过模糊 C 聚类法实现家庭负荷模型归类,获得设备针对不同电价的转移灵敏度和自灵敏度用电特性,并在此基础上形成家庭负荷特性。

通过电网公司分时电价环境下实测的家庭典型用电负荷数据验证可知,空调、洗衣机、热水器、电动汽车具有较 大的弹性,其中洗衣机的自弹性和交叉弹性最大,在高电价时段可削减 100%。

该方法所获得的家庭负荷辨识的结 果,可支持居民电价/激励等需求侧管理政策的制定,也可支持用户家庭用电设备状态监测服务等。

Computing Machinery and Intelligence

本篇文章是阅读阿兰图灵在1950年发表的论文 Computing Machinery and Intelligence

Bitcoin white paper 12. Conclusion

总结么,就是总结。

关键点“无须信用中介”“POW ”“P2P”“算力”“激励“。

Bitcoin white paper 11. Calculations

本章主要用概率论和代码来验证比特币系统的安全性,即说明攻击者的不可行。

发动攻击的过程实质上就是城市链和攻击链之间的赛跑。发动攻击者必须在正常链上发送一笔交易(一般来收,交易对象是交易所),之后在交易所确认改笔交易的同时,开始在这笔交易尚未发送时的区块基础上发送另一笔交易给自己或其他地址。然后让后笔交易取代正常链。

每个节点取得记账权的机会都是随机的,其概率与其算力成正比。而攻击者要做的,就是多次拿到这个记账权。就像足彩买复选,每多一次复选,概率也会降低。

白皮书用泊松分布来描述这以攻击进展。泊松分布的求解过程倒是十分简单。

Bitcoin white paper 10. Privacy

隐私,匿名。听起来就违法。区块链本身这一思想,就是在试图链接不可信环境中的个体,在无需信任的前提下,实现交易乃至更多。

随着区块链的发展,匿名功能实际上已经大大削弱了。监管机构、主权政府怎么会放任你匿名呢?当然社区中还是出现了很多匿名导向的币种,如门罗、大小零币等。使用如零知识证明等原理、混币或重铸等方式,来加强匿名性。

在比特币网络中。任何账户(公私钥对)的创建,都不需要资料的验证。这就从信息源上实现了隐私的保证。此外,账户创建是无成本的,如果我们有必要,完全可以由一个私钥对应成千上万个公钥(地址)。所以我们甚至可以说比特币持币前 100 地址中的 50 个地址都属于同一个人持有,私钥都不带换的。

这里依然有个 bug,“并行输入”。因为并行输入暗示着这些货币的持有者是同一个人,那么如果某一个人的某一个公钥被确认属于他,那么就可以追溯出此人的其他很多交易。

Bitcoin white paper 9. Combining and Splitting Value

数字化货币最核心的理念就是任何交易媒介都同质聚散——想象成水。

日常生活中,实物货币(各国纸币)的价值组合与分割,只能依靠三种条件:1.最小单位的累计,2.单位兑换组合3.实体分割。比如我们要支付 3 元,就得拿出三个一元的人名币;涉及到分,还得拿出分币;出现小于最小单位的支付金额,则无法完成支付。而当支付大额款项 500 元时,我们可以拿出 500 个一元或者 5000 张一角来支付,此时最小单位支付效率很低。这时,就出现了单位兑换组合,用纸币的组合来完成支付。但是若我们没有储存充足的单位货币,则交易就无法实现,也就是平常说的“找不开”。

到了互联网时代,网络支付则极大地解决了这个问题。一般来说,在高频系统内交易,都会设有资金池。除了提现和充值,我们的每笔交易实际上并不会发生数字货币的转移,中心化平台只发挥撮合订单的作用。

但这里也存在一个问题,资金池会被调用与其他作用,而客户完全不会发现;当资金管理系统出现问题,比如交易所被攻、跑路、查封时,客户资金便会受损甚至完全丢失。

第三种实物货币交易模式,如“黄金”、“土地”等,完全可以根据双方协商的金额进行分割。但明显,这种方式不适合日常使用,不具备传输的高效和安全性。

而比特币系统,就好比水,无论是谁的输入(资产)都会被融合到一起,不会出现无法分割的概念。如果有需要,大到 1000w,小到 0.001 厘的价值都可以被传输,且实现成本是相同的。其实在现在,用水类比已经不太恰当,以太坊已经推行 ERC721 等协议来试图在区块链中实现实物货币的概念。因为“水”的概念虽然可以用于单纯价值的传输,但对于附加和综合不同价值的(房产、古董),则无法完美呈现,因此,也诞生了很多不同的协议,来试图让区块链更好地适应和实现现实世界与实际场景。

比特币系统实现这样一种交易模式的方式就是公共账本,所有的交易都是被公开的价值传输。对于这些交易的真伪检验和安全,白皮书第二段也说明了。只需要检查交易方是否又足够的比特币即可。

Bitcoin white paper 8. Simplified Payment Verification

承接上一段的遗留问题,当链上节点保存的不再是完整的交易链信息时,就必须走一个简化的支付认证,这是一种折衷方案。

实现 SPV 的基础文中也反复提到,诚实节点占多数,即遵循共同规律的参与者应当始终是多数的。

对试图检验支付交易的用户,完整的全节点虽然记录了比特币系统的全部交易记录,但数量庞大,用此交易成本高。因此,用化简方案,根据比特币网络的特性,并不检验某笔交易本身,而是回溯其交易,根据该笔交易曾经被打包和打包块后续的区块来证明其存在(主链上某个区块存在后续区块,则说明已被全网认证)。

不直接查找全节点的另外一个原因就是不能保证数据源的绝对安全,且单个钱包的使用频率和数据调用量十分庞大,很难快捷高效地满足需求。

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×