Azure Data Lake の紹介

このポストは、4 月 29 日に投稿された Introducing Azure Data Lake の翻訳です。 「データ レイク」は、業界でもまだ新しい概念です。データ レイクとは、要件やスキーマを正式に定義するまで、収集したあらゆる種類のデータを 1 か所にまとめて保存する全社規模のレポジトリのことです。データ レイクを活用することで、保存するデータをサイズ、構造、取り込み速度によって区別する必要がなく、要件やスキーマが定義されたら Hadoop や高度な分析機能を使用して、データのパターンを割り出すことができます。データ レイクはまた、保存されたデータをデータ ウェアハウスに移行する前の準備を行うための低コストのレポジトリとしても利用できます。 データ レイクは膨大な可能性を秘めているものの、まだ完全に実現されるには至っていません。ストレージ容量、ハードウェアの調達、スケーラビリティ、パフォーマンス、コストといった問題が重なり、お客様がデータ レイクを導入できていないのが現状です。先日の Build (英語) では、クラウド内のビッグ データの分析ワークロードに使用可能なマイクロソフトのハイパー スケール レポジトリである Azure Data Lake が発表されました。クラウド向けに構築された Azure Data Lake は、HDFS との互換性があり、無制限のスケーリングやきわめて高いスループットを実現し、エンタープライズ クラスの機能を備えています。   クラウド向け HDFS: Azure Data Lake は HDFS と互換性のある Hadoop ファイル システムで、Azure HDInsight などのマイクロソフト製品、Revolution-R Enterprise、Hortonworks や Cloudera…

0

Build で発表された Azure の最新機能と技術革新をご紹介

このポストは、4 月 29 日に投稿された Azure peaks in the valley: New features and innovation の翻訳です。 Azure のあらゆる技術革新の中心にあるのは、開発者や独立系ソフトウェア ベンダーの要望に応えるというマイクロソフトの情熱です。本日の //build で発表した Azure サービスの新たな更新により、あらゆるタイプの開発者がさまざまなデバイスやプラットフォームに対応したクラウド アプリやクラウド サービスを柔軟に構築できるようになります。マイクロソフトは今回の更新によって、企業がデータから最大限の価値を引き出すことを可能にする予測分析およびインテリジェント アプリケーション向けの最も完全なプラットフォームを提供できるようになりました。 SQL Database の機能強化 今朝 Scott がステージ上でご紹介したとおり、SQL Database に対してさまざまな更新と機能強化を行いました。SaaS (サービスとしてのソフトウェア) アプリケーションの開発者は、SQL Database によって爆発的成長と収益性の高いビジネス モデルに同時に対応することができます。データベースのリソース消費量が予測できないワークロード向けには、プールしたリソースを複数のデータベースで利用できる柔軟なデータベース モデルのプレビュー版を導入します。ピーク時の需要に対応できるよう過剰にプロビジョニングするのではなく、柔軟なデータベース プールを利用して、予算の範囲内で数百または数千単位のデータベースでリソースを活用することができます。また、複数のデータベース全体のコストとパフォーマンスを制御できる購入モデルにより、コスト効率を高めることができます。SQL Database を使用して数多くのデータベースを管理する方法の詳細については、こちらを参照してください。 また、SQL Server の機能との互換性がほぼ完全になったことで、高負荷のワークロードの実行が可能になり、堅牢かつミッションクリティカルなクラウド アプリケーションを構築したり、既存のオンプレミス SQL Server のデータベースを Azure SQL Database に移行するためのプログラム可能な領域が提供されます。本日より、Azure SQL Database 用…

0

簡単に利用可能なハイブリッド クラウド: Availability on Demand で Azure に簡単に接続

このポストは、3 月 26 日に投稿された Hybrid Cloud without the Hassle, Simply Connect to Azure with Availability on Demand の翻訳です。 クラウド利用において可用性とは、災害復旧の点で重要なばかりでなく、データセンターとクラウド間の安全な接続や価値創造の基礎という点でも重要なものです。このたびマイクロソフトは、ハイブリッド環境と異種混在環境向けに、Azure に包括的な Availability on Demand 機能を追加することを発表しました。この機能により企業の皆様は、開発/テスト、クラウドによる高負荷対応、移行、レポート生成/分析、復旧、バックアップ、長期のデータ保持といったさまざまな目的に、クラウドのほぼ無制限のコンピューティング能力とストレージ容量を活用できるようになります。 マイクロソフトはこのサービスを通じて、オンプレミスの資産と Azure を合わせた他にはない単一の統合ソリューションを提供します。これによりいくつものソリューションを管理する手間を省き、複数のクラウド プロバイダーを組み合わせる必要もなくなります。環境に Hyper-V (英語)、物理サーバー (プレビュー) や VMware (プレビュー) の資産が含まれている場合でも、Availability on Demand を使用すると、ほんの数クリックで Azure の機能を利用することができます。Availability on Demand を使用してデータセンターを Azure に接続するだけで、必要に応じて自社のデータとアプリケーションを Azure から使用できるようになります。 セカンダリ DR サイトの構築と保守の必要がありません。 テープによるバックアップが不要で、Azure で最長 99 年間バックアップ データを保持できるため、時間とコストを節約できます。…

0

Azure Storage パフォーマンス チェックリスト

このポストは、11 月 18 日に投稿された Azure Storage Performance Checklist の翻訳です。 Azure Storage 利用時のパフォーマンスを最適化する方法については、TechEd や Build での講演、フォーラムのスレッド、ブログ記事、直接お会いしたときなど、これまでにたびたびご説明する機会がありました。アプリケーションのパフォーマンスを最大限に高めようという皆様の熱心な姿に大変心打たれます。 こうした皆様の目標を達成していただけるように、このたびマイクロソフトは Azure Storage パフォーマンス チェックリストを公開しました。このドキュメントにはパフォーマンスに関するガイダンスがまとめられており、ワンクリックで簡単に入手できます。印刷にして約 15 ページのこの短いドキュメントは開発者が 30 分程度で読めるもので、アプリケーションのパフォーマンスを向上させるために役立つ 40 以上の有効なベスト プラクティスの詳細がチェックリスト形式で提示されています。以下にチェックリストの一部を抜粋します。 完了 領域 カテゴリ 質問   BLOB メタデータの使用 各 BLOB を毎回ダウンロードする手間を省くために、頻繁に使用するメタデータを BLOB のメタデータに格納していますか?   BLOB 迅速なアップロード 1 つの BLOB を迅速にアップロードするときに、ブロックを並列アップロードしていますか?   Table 構成 Table 要求に JSON を使用していますか?   Table 返されるデータの限定…

0

Azure Storage サービスのサービス中断について

以下は、 11 月 22 日に追加投稿された部分の翻訳です。 水曜日 (PST) 以降、一部のお客さまについて火曜日 (PST) の Storage サービスのサービス中断の影響から完全に復旧するための最終の措置をとっていました。現在インシデントは解決し、システムが正常に稼働していることを確認しています。最新状況は、サービスダッシュボード: http://azure.microsoft.com/ja-jp/status/ で確認していただけます。もしお客様が、このインシデントに起因する問題がまだあるようだと思われる場合には azcommsm@microsoft.com (英語のみの受付となります)にご連絡いただければ、お客様のサポート契約の有無に関わらずサポートさせていただきます。このインシデントに関わるコミュニケーションに関してのフィードバックをいただいたことに対し、改めてお礼申し上げます。いただいたフィードバックを今後の計画に務めて取り込んでまいります。 このポストは、11 月 19 日に投稿された Update on Azure Storage Service Interruption の翻訳です。 太平洋標準時間の昨日、Azure Storage サービスで米国、ヨーロッパ、およびアジアの一部にかけてサービス中断が発生し、該当するリージョンでホストされている複数の Cloud Services に影響がありました。まず、サービス中断の発生につきまして、深くお詫びを申し上げます。平素よりお客様には多大な信頼をお寄せいただいており、マイクロソフトは今回の件について非常に重く受け止めております。この記事では、今回発生した問題の背景についてご説明いたします。 Azure Storage に適用するパフォーマンス関連の更新の中に問題が発見され、このために、Virtual Machines、Visual Studio Online、Websites、Search、などの Azure Storage を使用するマイクロソフトのサービス全般でキャパシティが低下しました。このパフォーマンス関連の更新を適用する前に、お客様向けの Azure Tables 用 Storage サービスのうちの一部において、数週間にわたってテストを実施しました。マイクロソフトではこの作業を「フライティング (flighting)」と呼び、更新をサービス全体にデプロイする前に問題を特定するため、必ず実施しています。このフライティング テストではパフォーマンスの大幅な向上が見られたため、Storage サービス全体に更新をデプロイする作業へと進みました。このデプロイ作業の中で問題が発見され、ストレージ BLOB フロントエンドが、フライティング テストのときには検出されなかった無限ループに陥りました。その結果、最終的にはフロントエンドが使用不能になりトラフィックの処理が停止されたため、その上に構築されている他のサービスにも問題が発生しました。 この問題が発見された後、変更は適切にロール バックされましたが、更新を完全に元に戻すにはストレージのフロントエンドの再起動が必要でした。修正方法がデプロイされてからは、影響を受けたリージョン全体でほとんどのお客様の可用性が復旧し始めました。サービスはリージョン全体でオンライン状態に戻っていますが、ごく一部のお客様ではまだ断続的に問題が発生しています。マイクロソフトのエンジニアリング チームとサポート チームは、この間、お客様の支援に積極的に対応しています。 今回のようなインシデントが発生した場合、マイクロソフトは、お客様のサービスを迅速に復旧することに集中して取り組みますが、それと同時に問題の原因を詳細に調査し、今後この問題が二度と発生しないように対策を講じます。マイクロソフトは、弊社プラットフォームでのお客様のエクスペリエンスの改善に引き続き取り組んでまいります。今後、RCA (根本原因の分析)…

0

Microsoft Azure WebJobs SDK の 1.0.0-rc1 を発表

このポストは、9 月 22 日に投稿された Announcing the 1.0.0-rc1 of Microsoft Azure WebJobs SDK の翻訳です。 マイクロソフトはこのたび、Microsoft Azure WebJobs SDK プレビューの新しいバージョンをリリースしました。WebJobs SDK については Scott Hanselman 氏がこちらで紹介 (英語) しています。以前のバージョンの詳細については、こちらの発表記事 (英語) (翻訳 – SATO NAOKI ブログ : Microsoft Azure WebJobs SDKの0.6.0-betaプレビューの発表) を参照してください。 今回のリリースは 0.6.0-beta と同じ基本機能に、バグの修正が加えられています。 このリリースをダウンロードする WebJobs SDK は、NuGet のギャラリーからダウンロードできます。NuGet ギャラリーで NuGet Package Manager Console を使用して、パッケージをインストールまたは更新します。 Install-Package Microsoft.Azure.WebJobs –Pre Microsoft Azure…

0

一部の Azure サービスで値下げを実施

このポストは、9 月 25 日に投稿された Microsoft Offers Price Reductions on Select Azure Services の翻訳です。 多くの企業でクラウドへの移行が進みつつあり、それと同時にアプリケーションの構築に使用されるサービスの種類もますます増加しています。マイクロソフトは、クラウドへの移行が進んでいる主な理由としてその経済性が注目されていることを鑑み、本日より一部の Azure サービスを Web サイトからご購入いただいた場合に料金を引き下げることを発表いたしました。なお、Enterprise Agreement 経由でご購入のお客様には、さらに高い割引率が引き続き適用されます。 次の表は、値下げが実施されるサービスのごく一部です。対象となるサービスの一覧はこちら (英語) をご覧ください。   現在の料金 改定後の料金 ExpressRoute NSP (1 Gbps) 12,000 ドル/月 8,700 ドル/月 BizTalk サービス (Standard) 4.03 ドル/時間 2.93 ドル/時間 今回の料金改定により、Azure のテクノロジをフルに活用しつつ、コスト効率をさらに高めながら完成度の高いソリューションを構築していただけるようになります。

0

Microsoft Azure Storage での同時実行制御の管理

このポストは、9 月 8 日に投稿された Managing Concurrency in Microsoft Azure Storage の翻訳です。 最新のインターネットを基盤とするアプリケーションでは、複数のユーザーが同時にデータを表示し、更新することが一般的です。このような場合、アプリケーション開発者は予測可能なエクスペリエンスをユーザーに提供する方法を注意深く検討する必要があり、特に複数のユーザーが同じデータを同時に更新できる場合はこれが重要となります。データの同時実行を処理する戦略としては、次の 3 つの手法が広く使用されます。 1. オプティミスティック同時実行制御 – アプリケーションでデータを更新する場合、更新処理の一部として、データがそのアプリケーションに最後に読み込まれた後に更新されていないかどうかを確認します。たとえば、wiki のページを閲覧している 2 人のユーザーが同じページを更新しようとしている場合、wiki のプラットフォームは、2 番目の更新が 1 番目の更新を上書きせず、また両方のユーザーがそれぞれの更新処理の成否を把握できるようにする必要があります。この戦略は、Web アプリケーションで最も広く使用されています。 2. ペシミスティック同時実行制御 – 更新を実行しようとするアプリケーションがオブジェクトをロックし、ロックが解除されるまで他のユーザーがデータを更新できないようにします。たとえば、マスターとスレーブの間でデータを複製する場合はマスターのみが更新を実行するため、通常は、データを一定期間排他的にロックして、該当するデータを他から更新できないようにします。 3. 最終書き込み者優先 – アプリケーションが最初にデータを読み込んだ後に他のアプリケーションが該当するデータを更新したかどうかを検証せず、すべての更新操作を実行します。この戦略 (つまり、確実な戦略を実装しない) は、通常、データがパーティション分割され、複数のユーザーが同時に同じデータにアクセスする可能性が十分に低い場合に使用されます。また、有効期限が短いデータ ストリームの処理にも有効です。 この記事では、Azure Storage プラットフォームで上記の 3 種類の同時実行制御戦略について業界最高クラスのサポートが提供されていることにより、開発がいかに簡素化されるかについて説明します。 Azure Storage – クラウド環境の開発を簡素化 Azure Storage サービスでは上記の 3 種類の戦略をすべてサポートしていますが、特にオプティミスティック同時実行制御とペシミスティック同時実行制御を完全にサポートしているという点が特徴的です。強力な整合性モデルを備えているため、Storage サービスでデータの挿入や更新の処理がコミットされた後にサービスがそのデータにアクセスした場合でも、確実に最新のデータが提供されます。結果整合性モデルを使用するストレージ プラットフォームでは、あるユーザーが書き込みを行ってから他のユーザーがそのデータを表示できるようになるまでにタイム ラグが発生します。エンド ユーザーがこの不整合の影響を受けないようにするために、クライアント…

0

Azure Search のシナリオと機能

このポストは、8 月 28 日に投稿した Azure Search Scenarios and Capabilities の翻訳です。 先週 Azure Search の発表 (英語) がありましたが、それに続いてこの記事では、Azure Search を開発した理由と、現在の機能を取り入れた経緯について説明します。 * 訳注: Azure Search は現在のところ日本語での検索には対応しておりません。 背景 検索機能は、数多くのアプリケーションでユーザーの主要な操作手法として活用されており、特に全文検索機能には大きな期待が寄せられています。ユーザーは、普段から Web 検索エンジン、高度な e コマース Web サイト、関連性の高い検索結果を提供するソーシャル アプリケーション、入力時の検索候補、ファセット ナビゲーション、強調表示などのさまざまな機能を、ほぼタイム ラグなしで使用しています。 マイクロソフトは Azure Search の開発にあたって、検索に関する専門的な知識のない開発者でも優れた検索エクスペリエンスをアプリケーションに組み込むことができるようにしたいと考えました。強固な検索エクスペリエンスの実現は、テキスト分析やランキングの処理が必要な情報取得用フロントエンドや、スケーラビリティや信頼性を管理する必要のある配信システムのフロントエンドのいずれにおいても課題となります。そこで、サービスとしての検索機能を提供することで、これらの課題を自然な形で解決し、開発者がアプリケーションの構築に集中できるようにすることを目指しました。 シナリオ 検索テクノロジを活用すると多様な課題を解決できますが、マイクロソフトでは、一貫性のある機能セットに重点的に取り組めるように、特定の対象シナリオを設定して開発を開始しました。もちろん、Azure Search は他にもさまざまな用途に使用できますが、これらのシナリオが原点となって、下記のサービスに対応した機能セットを採用することになりました。 オンライン販売および e コマース: e コマースのアプリケーションやサイトのユーザーのほとんどが、最初に検索機能で商品を探します。商品カタログにはインデックスが設けられ、展開するとタグ、説明、ユーザーからの意見などが表示されることもあります。このシナリオの特徴は、星による評価、価格/手数料、キャンペーンなどを考慮したきめ細かいランキング モデルであるという点です。検索エクスペリエンスには、多くの場合ファセット ナビゲーション (カテゴリごとの総数) やフィルター、さまざまな並び替えオプションなどの機能が含まれます。また、頻繁に更新が行われるという特徴もあります。商品カタログの更新頻度は低くても、商品価格、在庫状況、どのアイテムが販売中かなどの属性は 1 日のうちに何度も変わる場合があり、検索結果に迅速に反映される必要があります。 e コマースと最新のモバイル アプリケーションを検索機能でつないでいる実例として、AutoTrader.ca…

0

Azure SQL Database の標準地理レプリケーション

このポストは、9 月 3 日に投稿した Azure SQL Database Standard Geo-Replication の翻訳です。 今回の記事では、ビジネス継続性のシナリオを取り上げ、新しくリリースされた Azure SQL Database の標準地理レプリケーション機能について説明します。標準地理レプリケーション機能では、プライマリ データベースでコミットされたトランザクションを、事前に指定された Azure リージョンのセカンダリ データベースに非同期で複製するようにデータベースを構成できます。詳細の説明に入る前に、まずはプレビュー版として利用可能なビジネス継続性機能全般について簡単にまとめ、さらに 2014 年 4 月に発表した新しいサービス レベルに沿って説明します。各サービス レベルの詳細については、こちらの記事をご覧ください。 ビジネス継続性モデル 以前のアクティブ地理レプリケーションの記事では、筆者の Tobias Ternstrom がビジネス継続性の課題について説明しました。今回の記事の内容をより深くご理解いただくために、あらかじめ把握しておいていただきたいことをここで簡単にご紹介します。 災害復旧 (DR): アプリケーションの通常のビジネス機能を復元する処理。 特定時点への復元: 過去の (バックアップ保持期間内の) 特定の時点の状態にデータベースを復元する機能。人為的なミスやプログラムのエラーにより発生したデータ破損から復旧する際に使用します。 目標復旧時間 (RTO): 障害発生後アプリケーションの機能が完全に復旧するまでの最長のダウンタイム。 目標復旧時点 (RPO): 障害発生後アプリケーションの機能が完全に復旧するまでに失われる可能性のある、最新のデータ変更内容の最大量 (期間)。 次の表は、各サービス レベルで提供されているビジネス継続性機能をまとめたものです。 BCDR 機能 Basic レベル Standard レベル Premium レベル 特定時点への復元…

0