USENIX 最佳论文奖:擦除 Windows Azure 存储编码

我们发表了一篇介绍Windows Azure 存储如何用编码方式擦除数据的论文,此论文在 2012 年 6 月的 USENIX 技术年会上荣获最佳论文奖。这是 Microsoft Research 和 Windows Azure 存储团队共同努力的成果。

您可以在此处找到此论文。

Windows Azure 存储是一个云存储系统,可使客户能够按任何期限无限量存储数据,使数据具备高可用性和持久性。在使用 Windows Azure 存储时,您可以随时随地访问您的数据,而且只需为您所使用和存储的内容付费。

Windows Azure 存储如何工作的内部细节在我们的 SOSP 论文中有所介绍,您可单击此处查看此论文。SOSP 论文中简要说明的一个方面是,我们在保持您的数据持久性和高可用性的同时,在后台通过仅在需要时擦除数据来降低存储开销。

在 USENIX 论文中,我们介绍了 Windows Azure存储如何用编码方式擦除数据。我们引入了一个新的编码集,称之为本地重建编码 (LRC)。LRC 在重建离线数据段时,可减少需要读取的擦除编码段数量,但同时还能将存储开销保持在较低水平。LRC 的重要优势之一在于,可减少在之前编码上重建读取所需的带宽和 I/O,同时仍能显著降低存储开销。适用于在以下情况下有效重建段:(a) 单一段失败(如磁盘、节点或机架失败);(b) 升级导致段离线;或者 (c) 访问某个段速度较慢。在论文中,我们介绍了Windows Azure 存储如何使用 LRC,以提供具有持续低读取延迟的低开销持久存储。此外,我们还介绍了涉及其中的擦除编码实施和重要的设计决策。

Brad Calder

本文翻译自:

https://blogs.msdn.com/b/windowsazurestorage/archive/2012/06/13/usenix-best-paper-award-erasure-coding-in-windows-azure-storage.aspx