Visual Studio とデータ サイエンス ワークロードでインテリジェント アプリをすばやく構築

本記事は、マイクロソフト本社の The Visual Studio Blog の記事を抄訳したものです。【元記事】 Build Intelligent Apps Faster with Visual Studio and the Data Science Workload 2017/5/10

 

本日、Visual Studio 2017 のデータ サイエンス ワークロードと分析アプリケーション用ワークロードをリリースしました。この機能はしばらくの間プレビューとして提供されており、ローカリゼーションとアクセシビリティの対応が完了するまで時間がかかっていましたが、このたび満を持して一般提供が開始されました。

Installer

データ サイエンス (DS) ワークロードでは、3 つの言語と各ランタイム ディストリビューションを単一のワークロードとして提供します。

  • R と Microsoft R Client
  • Python と Anaconda
  • F# と .NET framework

R と Python はデータ サイエンスで使用される 2 大スクリプト言語です。どちらの言語も覚えやすく、充実したパッケージ エコシステムのサポートがあり、データ取得、データ クリーニング、モデル学習、広範なドメインへのデプロイなど、あらゆるシナリオに対応しています。F# は強力な関数型 .NET 言語で、幅広い種類のデータ処理タスクに適しています。

IDE

Visual Studio 2017 の F#、R Tools、Python Tools

SQL Server の Python

昨年マイクロソフトは SQL Server で R のサポートを開始しましたが、それに加え、今回新たに Python (英語) を追加しました。これにより、SQL Server 2017 CTP 2.0 (英語) のインストール時に、Python と Anaconda パッケージのサブセット (たとえば numpy、scipy、pandas など) を選択することで、SQL Server の既存データを利用した高度な分析を直接実行できるようになります。

Python T-SQL

T-SQL から直接 Python を呼び出す

Windows の SQL Server で Python を利用できます。今後 Linux でのサポートも予定されています。

R Tools の SQL のサポート

R Tools for Visual Studio では、プロジェクトへのデータベース接続文字列の追加や SQL ストアド プロシージャの開発、テスト、発行など、SQL を使用した作業の生産性が向上します。

RTVS SQL

SQL プロジェクトやストアド プロシージャを直接 Visual Studio と R で作成

R Tools と SQL 統合については、こちらのビデオ (英語) をご覧ください。また、R Tools 関連情報として、docs.microsoft.com に掲載されている「SQL Server と R を使用する (英語)」もご覧ください。

Jupyter Notebook サービスでの F#、R、Python のサポート

Data Science ワークロードの言語をサポートした無料の Jupyter Notebook サービスも提供します。Notebooks は REPL の強化版のようなもので、コード、マークダウン、インライン グラフィックなどに対応しています。https://notebooks.azure.com (英語) にアクセスしてフロント ページのサンプルをお試しください。

Jupyter Notebooks

Data Science ワークロードを構成する Python、R、F# Notebooks

フロント ページの [Introduction to Python (英語)] サンプルまたは [Introduction to F# (英語)] サンプルをクリックすると、Notebooks をお試しいただけます。

Visual Studio はエクスポートされた Jupyter の .py ファイルのインポート、実行、デバッグをサポートしています。ファイル内で Ctrl キーを押しながら Enter キーを押すとコード セルを 1 つずつ進めます。

まとめ

R、Python、F#、そしてパッケージのエコシステムはデータ サイエンスの幅広いシナリオに対応しています。Visual Studio 2017 のデータ サイエンス ワークロードはデータ取得、データ ラングリング、モデル構築、視覚化、デプロイメントまで、インテリジェント アプリをすばやく構築するために必要なすべての機能を提供します。また、SQL Server に Python と R が統合されたことでさらに拡張性が充実し、コードとデータの緊密な連携により不要なデータ移動を解消できます。ぜひワークロードをお試しのうえ、感想をお聞かせください。

Twitter: @pt4vs, @rt4vs @azurenotebooks

Github でのコード、バグ、機能のリクエスト先: github.com/{ptvs, rtvs, azurenotebooks}

Shahrokh Mortazavi (データ サイエンス ツール、パートナー PM)Shahrokh Mortazavi はマイクロソフトのデータ サイエンス デベロッパー ツール チームのマネージャーであり、Python、R、Jupyter Notebooks を担当しています。以前はマイクロソフトのハイ パフォーマンス コンピューティング グループの一員でした。Microsoft Research で Phoenix Compiler ツール チェーン (コード生成、分析、JIT) を担当していたこともあり、それ以前は 10 年間にわたって Sun Microsystems の Code Generation & Optimization コンパイラ バックエンド チームを率いていました。