推升 R 成為支援企業端與雲端跨平台分析的企業標準

    不到一年前,我們決定買下 R,全球最廣為採用的統計運算與分析預測程式語言,在商用軟體與服務領域的領導廠商 Revolution Analytics 公司 ( 請參考:decided to acquire Revolution Analytics ),在那時候,我們就致力於將 R 及其劃時代的技術建構在我們廣大的產品線,包括資料庫、巨量資料分析、以及商業智慧中 ( 請參考:we committed to ),讓我們的客戶和學生,在企業端或是 Azure 雲端,以及新的平台都能夠使用到統計,分析,與預測的功能,形成競爭的優勢。

到目前為止,我們已經發佈了以下許多新功能,同時也更新了一些原有的功能,讓我們的客戶和夥伴也都能夠享受 R 的威力:

  • 在 2015 年 6 月,我們成為 R Consortium 的創始會員之一,宣告了我們對 R 專案的承諾。
  • 在 2015 年10 月,我們以 Revolution R Enterprise 技術為基礎,發佈了 SQL Server R Service 功能,這是 SQL Server 2016 CTP3 內建的功能,將先進的分析技術整合到 SQL Server 資料庫。
  • 在 2015 年11 月,我們開始支援本機安裝的 Power BI 使用者管理並檢視 R 處理的資料 ( 請參考:visualize and operationalize data in R )。

這次,有更多令人感到興奮的新功能要公佈,這些功能可以協助新的平台、程式開發者、或是 R 社群提供以 R 為基礎的分析技術,包括:

      在多種平台提供 Microsoft R Server,可以支援我們的企業客戶不管是否使用那一種版本的 Hadoop 版本 ( Hortonworks、Cloudera、或是 MapR),那一種版本的 Linux ( Red Hat 或是 SUSE ),或是 Teradata,都能夠只使用一種核心工具,標準化進階分析的作業。對 Windows 的使用者,Microsoft R Server 會內建在 SQL Server 2016 中,也就是 SQL Server R Service 服務 – 內建 Microsoft R Server 的 SQL Server 的售價會比兩者分開購買的價格更加優惠。但是在 SQL Server 2016 正式發佈前,Revolution R Enterprise for Windows 都能夠以獨立的方式進行採購。

      IDC 的商業分析和資訊管理部門的程式開發副總裁 Dan Vesset 說:" 進階的預測與分析必須發展新的開發與測試模型,但是也需要程式開發者的努力,才能夠創造出具自動化決策支援功能的產品,進而為整個企業提供有效的決策支援。透過 Microsoft 對 R 分析決策技術的承諾與支援,Microsoft 在導入分析模型,提供具生產力的工具與程式開發支援方面,扮演了很重要的角色,成功地降低了使用進階的預測分析技術的門檻"。

除了近期發佈的新功能以外,我們將會持續不斷地在我們的產品中提供最佳的整合服務,以及更創新的功能,包括:

加上這些我們將要釋出的功能,就是我們對企業、R 程式開發者、資料科學家提供大規模的進階分析預測平台,協助建立企業端與雲端分析預測功能的應用程式的高成本效益解決方案的承諾。

認識 Microsoft R Server

      Microsoft R Server 是一個以 R 為基礎,支援在不同環境佈署的企業級分析平台,提供以 R 為基礎、高延展性、以及高安全性的運算環境。為了支援各種巨量資料統計運算,預測模型,以及機器學習的能力,R Server 支援完整的分析技術 – 探索 (exploration),分析 (analysis),視覺呈現 (visualization),以及建立模型 (modeling)。Microsoft R Server 使用開放原始碼 R,並加以擴充,但是仍保有與 R script、函式、與 CRAN 套件完整的相容性,提供企業層級的資料分析功能。除此之外,Microsoft R Server 也運用平行運算技術與分段處理資料的技術解決了開放原始碼 R 在 in-memory 運算的限制,協助使用能夠順利地對資料量比電腦主記憶體更大的資料進行分析與預測。

Microsoft 在買下 Revolution Analytics 公司之後,投注了很多心力加入了許多新功能 (詳細資料可以參考:Microsoft R Server – What is New? ),並且在開發新功能的時候努力讓 Revolution Analytics 的產品更加安全,更加國際化,降低入門使用門檻,同時也很容易安裝。以最新發佈的版本為例,其功能包括:

  • R 語言 3.2.2 版
  • Microsoft 提供的企業級支援
  • 符合 Microsoft's Security Development Cycle 軟體開發規範的企業層級安全性,包括威脅模型和攻擊層面分析,程式碼分析,以及延伸的模糊測試等等
  • 符合 Microsoft Accessibility Standards 規範的可用性
  • 支援中國政府 GB18030 編碼標準

使用 Hadoop 的客戶可使用 Microsoft R Server for Hadoop 在分散式的 Microsoft R Server 叢集建立和執行 R 模型,不需要放棄客戶原本喜好的R開發環境。Microsoft R Server for Hadoop 能夠自動將分析與預測的工作延展到 Hadoop 節點,不需要寫作複雜的程式碼。

        Hortonworks 公司的執行長 Rob Bearden 說:“ 在 Hortonworks,我們允許我們的客戶從動態的資料和靜態的資料建立具決策智慧的現代化資料分析應用程式。Microsoft’s R Server 和我們公司的 HDP 與 HDF 平台搭配之後可以提供一個以 R 語言為基礎的高延展性,企業層級的巨量資料與分析解決方案,作為數以百萬計的 R 程式開發者開發各種預測與分析應用程式的基石,分析來自網際網路數以 10 億計的各種資料來源,並轉換成有用的資料供企業參考"。

客戶可以利用 Microsoft R Server for Teradata 享受在 Teradata 提供的設備與資料庫中直接執行進階分析模型,對資料庫中的資料進行分析與預測的好處,不需要付出從資料庫取出欲分析的資料才能夠進行分析的代價。

        Teradata 公司 Product and Services Marketing 部門的副總裁 Chris Twogood 說:“ 我們非常高興 Microsoft 發佈了企業等級,具高延展性,以非常受歡迎的 R 語言為基礎的的巨量資料分析平台。 在 Microsoft 發佈了 Microsoft R Server for Teradata 之後,兩家公司共同的客戶就能夠在 Teradata 整合的資料倉儲設備,利用我們的硬體強大的威力和延展性執行進階的統計和預計分析運算。有了 Microsoft R Server for Teradata,我們的客戶能夠建立和佈署適用於零售業的應用程式,提供詐騙偵測,智慧型客戶關係管理,以及以 IoT 物聯網為基礎的預測維護等功能”。

我們提供的 Microsoft Data Science Virtual Machine 將會包含預先安裝,並設定妥當的 Microsoft R Server 開發者版本,支援 R 使用者能夠藉助於 Microsoft Azure 雲端平台,立即開始使用資料探索與建立模型等功能,不需要自行耗費精神和物力在企業端安裝和設定支援執行資料分析的環境。

認識 Microsoft R Open

      雖然 Revolution R Open 現在叫做 Microsoft R Open,但是 Microsoft 將會持續遵守自己的承諾,包括支援R開放原始碼專案,定期發表更新版,以及支援免費散佈 R 平台。Microsoft R Open 利用 Intel Math Kernel Libraries (MKL) 提供,適用於多執行緒處理器的最佳化運算,大幅地改良了 R 的執行效率,特別是矩陣相關的運算速度。除此之外,透過 Microsoft R Open 提供的簡化 R 套件版本管理功能,可以讓 R 使用者更容易地在 Microsoft Windows、Mac、以及 Linux 平台開發可靠的 R 解決方案。Microsoft R Open 百分之百相容於所有的 R script 和套件,而且和 R 一樣採取開放原始碼的形式,支援有需要的人免費下載,使用,和分享。

R 社群是 R 語言會成功的關鍵因素,也是資料科學家、統計學家、以及企業的重要資源。自從買下 Revolution acquisition 之後,Microsoft 持續支援 R 社群,包括擴展對 R 使用者社群和研討會的贊助,而且也增加了在R 開放原始碼專案的投資,提供 Microsoft R Open 和 DeployR Open (支援以 Web 服務的方式發行 R 的伺服器)的定期更新,提供包括檢查點 (checkpoint) 功能的新版本和更新版本的 R 套件,提供 R 套件的時間機器,支援在叢集執行 R 平行運算的 ParallelR,以及支援將 R 函式佈署到 Azure 雲端平台當做 API 的 Azure ML。除此之外,成為 R Consortium 創始成員之一就是 Microsoft 對支援 R Project 最明確的承諾。

        RStudio 公司的執行長 JJ Allaire 說:“ 身為 R Consortium 的成員,我們非常高興看到 Microsoft 加入支援 R 語言的行列,有像 Microsoft 這樣產品一流的公司在 R 的投資,R 語言已經準備妥跨足企業應用。我們期待能夠和 Microsoft 合作,提供容易佈署的環境、具商品品質的工具、以及基礎建設,為客戶創造成功的環境”。

對 Microsoft R Open 有興趣的讀者可以閱讀 R Community 社群領導 David Smith 發表的文章:the post。有意開始學習 Microsoft R Server 與 Microsoft R Open 的讀者可以到 upcoming webinar series 網站註冊參與以下的網路研討會。

January 28, 2016

Intro to Microsoft R Open

David Smith

February 4, 2016

Using Microsoft R Server to Address Scalability Issues in R

Derek Norton

February 11, 2016

Data Mining with Microsoft R Server

Derek Norton

February 18, 2016

Best Practices for using Microsoft R Server with Hadoop

Jamie Olson

February 25, 2016

Using Microsoft R Server to Operationalize your Analytics

Jamie Olson

 

 

 

 

 

 

 

  

 

學習參考資料連結

本文翻譯自:Making R the Enterprise Standard for Cross-Platform Analytics, Both On-Premises and in the Cloud

 

提醒您,社群之星『學新知拿好禮』活動進行中,快去搶禮物!想知道更多第一手消息,請鎖定 MSDN 台灣