You are viewing a plain text version of this content. The canonical link for it is here.
Posted to commits@arrow.apache.org by we...@apache.org on 2017/05/11 21:03:17 UTC

arrow-site git commit: Update site per @kou additions

Repository: arrow-site
Updated Branches:
  refs/heads/asf-site 3f1ca5966 -> 3a7bab251


Update site per @kou additions


Project: http://git-wip-us.apache.org/repos/asf/arrow-site/repo
Commit: http://git-wip-us.apache.org/repos/asf/arrow-site/commit/3a7bab25
Tree: http://git-wip-us.apache.org/repos/asf/arrow-site/tree/3a7bab25
Diff: http://git-wip-us.apache.org/repos/asf/arrow-site/diff/3a7bab25

Branch: refs/heads/asf-site
Commit: 3a7bab2514da24c7a3e98b365266b49cdf092bf2
Parents: 3f1ca59
Author: Wes McKinney <we...@twosigma.com>
Authored: Thu May 11 17:03:10 2017 -0400
Committer: Wes McKinney <we...@twosigma.com>
Committed: Thu May 11 17:03:10 2017 -0400

----------------------------------------------------------------------
 blog/2017/05/08/0.3-release-japanese/index.html | 275 +++++++++++++++++++
 blog/2017/05/08/0.3-release/index.html          |   6 +-
 blog/index.html                                 |  10 +-
 feed.xml                                        | 144 +++++++++-
 install/index.html                              |  74 ++++-
 5 files changed, 501 insertions(+), 8 deletions(-)
----------------------------------------------------------------------


http://git-wip-us.apache.org/repos/asf/arrow-site/blob/3a7bab25/blog/2017/05/08/0.3-release-japanese/index.html
----------------------------------------------------------------------
diff --git a/blog/2017/05/08/0.3-release-japanese/index.html b/blog/2017/05/08/0.3-release-japanese/index.html
new file mode 100644
index 0000000..b284171
--- /dev/null
+++ b/blog/2017/05/08/0.3-release-japanese/index.html
@@ -0,0 +1,275 @@
+<!DOCTYPE html>
+<html lang="en-US">
+  <head>
+    <meta charset="UTF-8">
+    <title>Apache Arrow 0.3.0リリース</title>
+    <meta http-equiv="X-UA-Compatible" content="IE=edge">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="Jekyll v3.4.3">
+    <!-- The above 3 meta tags *must* come first in the head; any other head content must come *after* these tags -->
+    <link rel="icon" type="image/x-icon" href="/favicon.ico">
+
+    <title>Apache Arrow Homepage</title>
+    <link rel="stylesheet" href="//fonts.googleapis.com/css?family=Lato:300,300italic,400,400italic,700,700italic,900">
+
+    <link href="/css/main.css" rel="stylesheet">
+    <script src="https://code.jquery.com/jquery-3.2.1.min.js"
+            integrity="sha256-hwg4gsxgFZhOsEEamdOYGBf13FyQuiTwlAQgxVSNgt4="
+            crossorigin="anonymous"></script>
+    <script src="/assets/javascripts/bootstrap.min.js"></script>
+  </head>
+
+
+
+<body class="wrap">
+  <div class="container">
+    <nav class="navbar navbar-default">
+  <div class="container-fluid">
+    <div class="navbar-header">
+      <button type="button" class="navbar-toggle" data-toggle="collapse" data-target="#arrow-navbar">
+        <span class="sr-only">Toggle navigation</span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+        <span class="icon-bar"></span>
+      </button>
+      <a class="navbar-brand" href="/">Apache Arrow&#8482;&nbsp;&nbsp;&nbsp;</a>
+    </div>
+
+    <!-- Collect the nav links, forms, and other content for toggling -->
+    <div class="collapse navbar-collapse" id="arrow-navbar">
+      <ul class="nav navbar-nav">
+        <li class="dropdown">
+          <a href="#" class="dropdown-toggle" data-toggle="dropdown"
+             role="button" aria-haspopup="true"
+             aria-expanded="false">Project Links<span class="caret"></span>
+          </a>
+          <ul class="dropdown-menu">
+            <li><a href="/install/">Install</a></li>
+            <li><a href="/blog/">Blog</a></li>
+            <li><a href="/release/">Releases</a></li>
+            <li><a href="https://issues.apache.org/jira/browse/ARROW">Issue Tracker</a></li>
+            <li><a href="https://github.com/apache/arrow">Source Code</a></li>
+            <li><a href="http://mail-archives.apache.org/mod_mbox/arrow-dev/">Mailing List</a></li>
+            <li><a href="https://apachearrowslackin.herokuapp.com">Slack Channel</a></li>
+            <li><a href="/committers/">Committers</a></li>
+          </ul>
+        </li>
+        <li class="dropdown">
+          <a href="#" class="dropdown-toggle" data-toggle="dropdown"
+             role="button" aria-haspopup="true"
+             aria-expanded="false">Specification<span class="caret"></span>
+          </a>
+          <ul class="dropdown-menu">
+            <li><a href="/docs/memory_layout.html">Memory Layout</a></li>
+            <li><a href="/docs/metadata.html">Metadata</a></li>
+            <li><a href="/docs/ipc.html">Messaging / IPC</a></li>
+          </ul>
+        </li>
+
+        <li class="dropdown">
+          <a href="#" class="dropdown-toggle" data-toggle="dropdown"
+             role="button" aria-haspopup="true"
+             aria-expanded="false">Documentation<span class="caret"></span>
+          </a>
+          <ul class="dropdown-menu">
+            <li><a href="/docs/python">Python</a></li>
+            <li><a href="/docs/cpp">C++ API</a></li>
+            <li><a href="/docs/java">Java API</a></li>
+            <li><a href="/docs/c_glib">C GLib API</a></li>
+          </ul>
+        </li>
+        <!-- <li><a href="/blog">Blog</a></li> -->
+        <li class="dropdown">
+          <a href="#" class="dropdown-toggle" data-toggle="dropdown"
+             role="button" aria-haspopup="true"
+             aria-expanded="false">ASF Links<span class="caret"></span>
+          </a>
+          <ul class="dropdown-menu">
+            <li><a href="http://www.apache.org/">ASF Website</a></li>
+            <li><a href="http://www.apache.org/licenses/">License</a></li>
+            <li><a href="http://www.apache.org/foundation/sponsorship.html">Donate</a></li>
+            <li><a href="http://www.apache.org/foundation/thanks.html">Thanks</a></li>
+            <li><a href="http://www.apache.org/security/">Security</a></li>
+          </ul>
+        </li>
+      </ul>
+      <a href="http://www.apache.org/">
+        <img style="float:right;" src="/img/asf_logo.svg" width="120px"/>
+      </a>
+      </div><!-- /.navbar-collapse -->
+    </div>
+  </nav>
+
+
+    <h2>
+      Apache Arrow 0.3.0リリース
+      <a href="/blog/2017/05/08/0.3-release-japanese/" class="permalink" title="Permalink">∞</a>
+    </h2>
+
+    
+
+    <div class="panel">
+      <div class="panel-body">
+        <div>
+          <span class="label label-default">Published</span>
+          <span class="published">
+            <i class="fa fa-calendar"></i>
+            08 May 2017
+          </span>
+        </div>
+        <div>
+          <span class="label label-default">By</span>
+          <a href="http://wesmckinney.com"><i class="fa fa-user"></i> Wes McKinney (wesm)</a>
+        </div>
+      </div>
+    </div>
+
+    <!--
+
+-->
+
+<p><a href="/blog/2017/05/08/0.3-release/">原文(English)</a></p>
+
+<p>Apache Arrowチームは0.3.0のリリースをアナウンスできてうれしいです。2月にリリースした0.2.0から10週間の活発な開発の結果が今回のリリースです。<a href="https://github.com/apache/arrow/graphs/contributors"><strong>23人のコントリビューター</strong></a>が<a href="https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0"><strong>306個のJIRAのissueを解決</strong></a>しました。</p>
+
+<p>複数のArrowの実装にたくさんの新しい機能を追加しています。2017年、特に注力して開発するのは、インメモリー用のフォーマット、型のメタデータ、メッセージング用のプロトコルです。これは、ビッグデータアプリケーションに<strong>安定していてプロダクションで使える基盤</strong>を提供するためです。高性能IOとインメモリーデータ処理にArrowを活用するために、<a href="http://spark.apache.org">Apache Spark</a>・<a href="http://www.geomesa.org/">GeoMesa</a>コミュニティーと協力していてとてもエキサイティングです。</p>
+
+<p>それぞれのプラットフォームでArrowを使う方法は<a href="http://arrow.apache.org/install">インストールページ</a>を見てください。</p>
+
+<p>Arrowでビッグデータシステムを高速化するケースを増やすために、近いうちにApache Arrowのロードマップを公開する予定です。</p>
+
+<p>Arrowの開発に参加するコントリビューターを募集しています。すでにArrowの開発に参加しているコミュニティーからのコントリビューターもそうですし、まだ参加していないGo、R、Juliaといったコミュニティーからのコントリビューターも募集しています。</p>
+
+<h3 id="ファイルフォーマットとストリーミングフォーマットの強化">ファイルフォーマットとストリーミングフォーマットの強化</h3>
+
+<p>0.2.0では<strong>ランダムアクセス</strong>用と<strong>ストリーミング</strong>用のArrowのワイヤーフォーマットを導入しました。実装の詳細は<a href="http://arrow.apache.org/docs/ipc.html">IPC仕様</a>を見てください。ユースケースは<a href="http://wesmckinney.com/blog/arrow-streaming-columnar/">使用例を紹介したブログ</a>を見てください。これらのフォーマットを使うと低オーバーヘッド・コピーなしでArrowのレコードバッチのペイロードにアクセスできます。</p>
+
+<p>0.3.0ではこのバイナリーフォマットの細かい詳細をたくさん固めました。Java、C++、Python間の連携のテストおよびそれぞれ言語での単体テストの整備も進めました。<a href="http://github.com/google/flatbuffers">Google Flatbuffers</a>は、前方互換性を壊さずにメタデータに新しい機能を追加するのに非常に助かりました。</p>
+
+<p>まだバイナリーフォーマットの前方互換性を必ず壊さないと約束できる状態ではありませんが(もしかしたら変更する必要があるなにかが見つかるかもしれない)、メジャーリリース間では不必要に互換性を壊さないように努力するつもりです。Apache ArrowのWebサイト、各コンポーネントのユーザー向けのドキュメントおよびAPIドキュメントへのコントリビューションを非常に歓迎します。</p>
+
+<h3 id="辞書エンコーディングのサポート">辞書エンコーディングのサポート</h3>
+
+<p><a href="http://www.geomesa.org/">GeoMesa</a>プロジェクトの<a href="https://github.com/elahrvivaz">Emilio Lahr-Vivaz</a>はJavaのArrow実装に辞書エンコード対応ベクターをコントリビュートしました。これを受けて、C++とPythonでもサポートしました。(<code class="highlighter-rouge">pandas.Categorical</code>とも連携できます。)辞書エンコーディング用のインテグレーションテスト(C++とJava間でこのデータを送受信するテスト)はまだ完成していませんが、0.4.0までには完成させたいです。</p>
+
+<p>これはカテゴリーデータ用の一般的なデータ表現テクニックです。これを使うと、複数のレコードバッチで共通の「辞書」を共有し、各レコードバッチの値はこの辞書を参照する整数になります。このデータは統計的言語(statistical language)の分野では「カテゴリー(categorical)」や「因子(factor)」と呼ばれています。Apache Parquetのようなファイルフォーマットの分野ではデータ圧縮のためだけに使われています。</p>
+
+<h3 id="日付時刻固定長型の拡張">日付、時刻、固定長型の拡張</h3>
+
+<p>0.2.0では現実に使われている日付・時刻型をインテグレーションテスト付きで完全にサポートすることを諦めました。これらは<a href="http://parquet.apache.org">Apache Parquet</a>とApache Sparkとの連携に必要な機能です。</p>
+
+<ul>
+  <li><strong>日付</strong>: 32-bit(日単位)と64-bit(ミリ秒単位)</li>
+  <li><strong>時刻</strong>: 単位付き64-bit整数(単位:秒、ミリ秒、マイクロ秒、ナノ秒)</li>
+  <li><strong>タイムスタンプ(UNIXエポックからの経過時間)</strong>: 単位付き64-bit整数のタイムゾーン付きとタイムゾーンなし</li>
+  <li><strong>固定長バイナリー</strong>: 決まったバイト数のプリミティブな値</li>
+  <li><strong>固定長リスト</strong>: 各要素が同じサイズのリスト(要素のベクターとは別にオフセットのベクターを持つ必要がない)</li>
+</ul>
+
+<p>C++のArrow実装では、<a href="https://github.com/boostorg/multiprecision">Boost.Multiprecision</a>を使ったexactな小数のサポートを実験的に追加しました。ただし、Java実装とC++実装間での小数のメモリーフォーマットはまだ固まっていません。</p>
+
+<h3 id="cとpythonのwindowsサポート">C++とPythonのWindowsサポート</h3>
+
+<p>一般的なC++とPythonでの開発用に、パッケージ周りの改良も多数入っています。0.3.0はVisual Studio(MSVC)2015と2017を使ってWindowsを完全にサポートした最初のバージョンです。AppveyorでMSVC用のCIを実行しています。Windows上でソースからビルドするためのガイドも書きました。<a href="https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md">C++</a>用と<a href="https://github.com/apache/arrow/blob/master/python/doc/source/development.rst">Python</a>用。</p>
+
+<p><a href="https://conda-forge.github.io">conda-forge</a>からWindows用のArrowのPythonライブラリーをインストールできます。</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>conda install pyarrow -c conda-forge
+</code></pre>
+</div>
+
+<h3 id="cglibバインディングとrubylua他のサポート">C(GLib)バインディングとRuby・Lua・他のサポート</h3>
+
+<p><a href="http://github.com/kou">Kouhei Sutou</a>は新しいApache Arrowのコントリビューターです。Linux用の(ArrowのC++実装の)GLibを使ったCバインディングをコントリビュートしました。<a href="https://wiki.gnome.org/Projects/GObjectIntrospection">GObject Introspection</a>というCのミドルウェアを使うことでRuby、Lua、Goや<a href="https://wiki.gnome.org/Projects/GObjectIntrospection/Users">他にも様々なプログラミング言語</a>でシームレスにバインディングを使うことができます。これらのバインディングがどのように動いているか、これらのバインディングをどのように使うかを説明するブログ記事が別途必要な気がします。</p>
+
+<h3 id="pysparkを使ったapache-sparkとの連携">PySparkを使ったApache Sparkとの連携</h3>
+
+<p><a href="https://issues.apache.org/jira/browse/SPARK-13534">SPARK-13534</a>でApache Sparkコミュニティーと協力しています。PySparkでの<code class="highlighter-rouge">DataFrame.toPandas</code>をArrowを使って高速化しようとしています。効率的なデータのシリアライズにより<a href="https://github.com/apache/spark/pull/15821#issuecomment-282175163"><strong>40倍以上高速化</strong></a>できるケースがあります。</p>
+
+<p>PySparkでArrowを使うことでこれまでできなかったパフォーマンス最適化の道が開けました。特に、UDFの評価まわりでいろいろやれることがあるでしょう。(たとえば、Pythonのラムダ関数を使って<code class="highlighter-rouge">map</code>・<code class="highlighter-rouge">filter</code>を実行するケース。)</p>
+
+<h3 id="python実装での新しい機能メモリービューfeatherapache-parquetのサポート">Python実装での新しい機能:メモリービュー、Feather、Apache Parquetのサポート</h3>
+
+<p>ArrowのPythonライブラリーである<code class="highlighter-rouge">pyarrow</code>は<code class="highlighter-rouge">libarrow</code>と<code class="highlighter-rouge">libarrow_python</code>というC++ライブラリーのCythonバインディングです。<code class="highlighter-rouge">pyarrow</code>はNumPyと<a href="http://pandas.pydata.org">pandas</a>とPythonの標準ライブラリー間のシームレスな連携を実現します。</p>
+
+<p>ArrowのC++ライブラリーで最も重要なものは<code class="highlighter-rouge">arrow::Buffer</code>オブジェクトです。これはメモリービューを管理します。コピーなしの読み込みとスライスをサポートしている点が重要です。<a href="https://github.com/JeffKnupp">Jeff Knupp</a>はArrowのバッファーとPythonのバッファープロトコルとmemoryviewの連携処理をコントリビュートしました。これにより次のようなことができるようになりました。</p>
+
+<div class="language-python highlighter-rouge"><pre class="highlight"><code><span class="n">In</span> <span class="p">[</span><span class="mi">6</span><span class="p">]:</span> <span class="kn">import</span> <span class="nn">pyarrow</span> <span class="kn">as</span> <span class="nn">pa</span>
+
+<span class="n">In</span> <span class="p">[</span><span class="mi">7</span><span class="p">]:</span> <span class="n">buf</span> <span class="o">=</span> <span class="n">pa</span><span class="o">.</span><span class="n">frombuffer</span><span class="p">(</span><span class="n">b</span><span class="s">'foobarbaz'</span><span class="p">)</span>
+
+<span class="n">In</span> <span class="p">[</span><span class="mi">8</span><span class="p">]:</span> <span class="n">buf</span>
+<span class="n">Out</span><span class="p">[</span><span class="mi">8</span><span class="p">]:</span> <span class="o">&lt;</span><span class="n">pyarrow</span><span class="o">.</span><span class="n">_io</span><span class="o">.</span><span class="n">Buffer</span> <span class="n">at</span> <span class="mh">0x7f6c0a84b538</span><span class="o">&gt;</span>
+
+<span class="n">In</span> <span class="p">[</span><span class="mi">9</span><span class="p">]:</span> <span class="n">memoryview</span><span class="p">(</span><span class="n">buf</span><span class="p">)</span>
+<span class="n">Out</span><span class="p">[</span><span class="mi">9</span><span class="p">]:</span> <span class="o">&lt;</span><span class="n">memory</span> <span class="n">at</span> <span class="mh">0x7f6c0a8c5e88</span><span class="o">&gt;</span>
+
+<span class="n">In</span> <span class="p">[</span><span class="mi">10</span><span class="p">]:</span> <span class="n">buf</span><span class="o">.</span><span class="n">to_pybytes</span><span class="p">()</span>
+<span class="n">Out</span><span class="p">[</span><span class="mi">10</span><span class="p">]:</span> <span class="n">b</span><span class="s">'foobarbaz'</span>
+</code></pre>
+</div>
+
+<p>C++でのParquet実装である<a href="https://github.com/apache/parquet-cpp">parquet-cpp</a>を使うことで大幅に<a href="http://parquet.apache.org"><strong>Apache Parquet</strong></a>サポートを改良しました。たとえば、ディスク上にあるかHDFS上にあるか関係なく、パーティションされたデータセットをサポートしました。<a href="https://github.com/dask/dask/commit/68f9e417924a985c1f2e2a587126833c70a2e9f4">Daskプロジェクト</a>はArrowを使ったParquetサポートを実装した最初のプロジェクトです。Dask開発者とはpandsデータを分散処理する文脈でさらに協力できることを楽しみにしています。</p>
+
+<p>pandasを成熟させるためにArrowを改良することもあり、<a href="https://github.com/wesm/feather"><strong>Featherフォーマット</strong></a>の実装をマージしたのもその1つです。Featherフォーマットは本質的にはArrowのランダムアクセスフォーマットの特別なケースの1つです。ArrowのコードベースでFeatherの開発を続けます。たとえば、今のFeatherはArrowのPythonバインディングのレイヤーを使うことでPythonのファイルオブジェクトを読み書きできるようになっています。</p>
+
+<p><code class="highlighter-rouge">DatetimeTZ</code>や<code class="highlighter-rouge">Categorical</code>といったpandas固有のデータ型のちゃんとした(robust)サポートも実装しました。</p>
+
+<h3 id="cライブラリーでのテンソルサポート">C++ライブラリーでのテンソルサポート</h3>
+
+<p>Apache Arrowはコピーなしで共有メモリーを管理するツールという側面があります。機械学習アプリケーションの文脈でこの機能への関心が増えています。UCバークレー校の<a href="https://rise.cs.berkeley.edu/">RISELab</a>の<a href="https://github.com/ray-project/ray">Rayプロジェクト</a>が最初の例です。</p>
+
+<p>機械学習ではは「テンソル」とも呼ばれる多次元配列というデータ構造を扱います。このようなデータ構造はArrowのカラムフォーマットがサポートしているデータ構造の範囲を超えています。今回のケースでは、<a href="http://arrow.apache.org/docs/cpp/classarrow_1_1_tensor.html"><code class="highlighter-rouge">arrow::Tensor</code></a>というC++の型を追加で実装しました。これはArrowのコピーなしの共有メモリー機能を活用して実装しました。(メモリーの生存期間の管理に<code class="highlighter-rouge">arrow::Buffer</code>を使いました。)C++実装では、これからも、共通のIO・メモリー管理ツールとしてArrowを活用できるようにするため、追加のデータ構造を提供するつもりです。</p>
+
+<h3 id="javascripttypescript実装の開始">JavaScript(TypeScript)実装の開始</h3>
+
+<p><a href="https://github.com/TheNeuralBit">Brian Hulette</a>はNodeJSとWebブラウザー上で動くアプリケーションで使うために<a href="https://github.com/apache/arrow/tree/master/js">TypeScript</a>でのArrowの実装を始めました。FlatBuffersがJavaScriptをファーストクラスでサポートしているので実装が捗ります。</p>
+
+<h3 id="webサイトと開発者用ドキュメントの改良">Webサイトと開発者用ドキュメントの改良</h3>
+
+<p>0.2.0をリリースしてからドキュメントとブログを公開するためにWebサイトのシステムを<a href="https://jekyllrb.com">Jekyll</a>ベースで作りました。Kouhei Sutouは<a href="https://github.com/red-data-tools/jekyll-jupyter-notebook">Jekyll Jupyter Notebookプラグイン</a>を作りました。これによりArrowのWebサイトのコンテンツを作るためにJupyterを使うことができます。</p>
+
+<p>WebサイトにはC、C++、Java、PythonのAPIドキュメントを公開しました。これらの中にArrowを使い始めるための有益な情報を見つけられるでしょう。</p>
+
+<h3 id="コントリビューター">コントリビューター</h3>
+
+<p>このリリースにパッチをコントリビュートしたみなさんに感謝します。</p>
+
+<div class="highlighter-rouge"><pre class="highlight"><code>$ git shortlog -sn apache-arrow-0.2.0..apache-arrow-0.3.0
+    119 Wes McKinney
+     55 Kouhei Sutou
+     18 Uwe L. Korn
+     17 Julien Le Dem
+      9 Phillip Cloud
+      6 Bryan Cutler
+      5 Philipp Moritz
+      5 Emilio Lahr-Vivaz
+      4 Max Risuhin
+      4 Johan Mabille
+      4 Jeff Knupp
+      3 Steven Phillips
+      3 Miki Tebeka
+      2 Leif Walsh
+      2 Jeff Reback
+      2 Brian Hulette
+      1 Tsuyoshi Ozawa
+      1 rvernica
+      1 Nong Li
+      1 Julien Lafaye
+      1 Itai Incze
+      1 Holden Karau
+      1 Deepak Majeti
+</code></pre>
+</div>
+
+
+
+    <hr/>
+<footer class="footer">
+  <p>Apache Arrow, Arrow, Apache, the Apache feather logo, and the Apache Arrow project logo are either registered trademarks or trademarks of The Apache Software Foundation in the United States and other countries.</p>
+  <p>&copy; 2017 Apache Software Foundation</p>
+</footer>
+
+  </div>
+</body>
+</html>

http://git-wip-us.apache.org/repos/asf/arrow-site/blob/3a7bab25/blog/2017/05/08/0.3-release/index.html
----------------------------------------------------------------------
diff --git a/blog/2017/05/08/0.3-release/index.html b/blog/2017/05/08/0.3-release/index.html
index a0c949c..fa65582 100644
--- a/blog/2017/05/08/0.3-release/index.html
+++ b/blog/2017/05/08/0.3-release/index.html
@@ -128,6 +128,8 @@
 
 -->
 
+<p>Translations: <a href="/blog/2017/05/08/0.3-release-japanese/">日本語</a></p>
+
 <p>The Apache Arrow team is pleased to announce the 0.3.0 release of the
 project. It is the product of an intense 10 weeks of development since the
 0.2.0 release from this past February. It includes <a href="https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0"><strong>306 resolved JIRAs</strong></a>
@@ -208,7 +210,7 @@ to adding Appveyor continuous integration for MSVC, we have also written guides
 for building from source on Windows: <a href="https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md">C++</a> and <a href="https://github.com/apache/arrow/blob/master/python/doc/source/development.rst">Python</a>.</p>
 
 <p>For the first time, you can install the Arrow Python library on Windows from
-[conda-forge][31]:</p>
+<a href="https://conda-forge.github.io">conda-forge</a>:</p>
 
 <div class="language-shell highlighter-rouge"><pre class="highlight"><code>conda install pyarrow -c conda-forge
 </code></pre>
@@ -291,7 +293,7 @@ additional data structures utilizing common IO and memory management tools.</p>
 <h3 id="start-of-javascript-typescript-implementation">Start of JavaScript (TypeScript) Implementation</h3>
 
 <p><a href="https://github.com/TheNeuralBit">Brian Hulette</a> started developing an Arrow implementation in
-<a href="https://conda-forge.github.io">TypeScript</a> for use in NodeJS and browser-side applications. We are
+<a href="https://github.com/apache/arrow/tree/master/js">TypeScript</a> for use in NodeJS and browser-side applications. We are
 benefitting from Flatbuffers’ first class support for JavaScript.</p>
 
 <h3 id="improved-website-and-developer-documentation">Improved Website and Developer Documentation</h3>

http://git-wip-us.apache.org/repos/asf/arrow-site/blob/3a7bab25/blog/index.html
----------------------------------------------------------------------
diff --git a/blog/index.html b/blog/index.html
index 8ae9f9b..f2aadf2 100644
--- a/blog/index.html
+++ b/blog/index.html
@@ -107,6 +107,7 @@
 
 
   
+    
   <div class="container">
     <h2>
       Apache Arrow 0.3.0 Release
@@ -134,6 +135,8 @@
 
 -->
 
+<p>Translations: <a href="/blog/2017/05/08/0.3-release-japanese/">日本語</a></p>
+
 <p>The Apache Arrow team is pleased to announce the 0.3.0 release of the
 project. It is the product of an intense 10 weeks of development since the
 0.2.0 release from this past February. It includes <a href="https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0"><strong>306 resolved JIRAs</strong></a>
@@ -214,7 +217,7 @@ to adding Appveyor continuous integration for MSVC, we have also written guides
 for building from source on Windows: <a href="https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md">C++</a> and <a href="https://github.com/apache/arrow/blob/master/python/doc/source/development.rst">Python</a>.</p>
 
 <p>For the first time, you can install the Arrow Python library on Windows from
-[conda-forge][31]:</p>
+<a href="https://conda-forge.github.io">conda-forge</a>:</p>
 
 <div class="language-shell highlighter-rouge"><pre class="highlight"><code>conda install pyarrow -c conda-forge
 </code></pre>
@@ -297,7 +300,7 @@ additional data structures utilizing common IO and memory management tools.</p>
 <h3 id="start-of-javascript-typescript-implementation">Start of JavaScript (TypeScript) Implementation</h3>
 
 <p><a href="https://github.com/TheNeuralBit">Brian Hulette</a> started developing an Arrow implementation in
-<a href="https://conda-forge.github.io">TypeScript</a> for use in NodeJS and browser-side applications. We are
+<a href="https://github.com/apache/arrow/tree/master/js">TypeScript</a> for use in NodeJS and browser-side applications. We are
 benefitting from Flatbuffers’ first class support for JavaScript.</p>
 
 <h3 id="improved-website-and-developer-documentation">Improved Website and Developer Documentation</h3>
@@ -345,6 +348,9 @@ instructions for getting started.</p>
 
   </div>
 
+  
+
+  
 
 
 

http://git-wip-us.apache.org/repos/asf/arrow-site/blob/3a7bab25/feed.xml
----------------------------------------------------------------------
diff --git a/feed.xml b/feed.xml
index 4008b1c..c30ad1c 100644
--- a/feed.xml
+++ b/feed.xml
@@ -1,7 +1,9 @@
-<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.4.3">Jekyll</generator><link href="http://localhost:4000/feed.xml" rel="self" type="application/atom+xml" /><link href="http://localhost:4000/" rel="alternate" type="text/html" /><updated>2017-05-08T09:44:38-04:00</updated><id>http://localhost:4000/</id><entry><title type="html">Apache Arrow 0.3.0 Release</title><link href="http://localhost:4000/blog/2017/05/08/0.3-release/" rel="alternate" type="text/html" title="Apache Arrow 0.3.0 Release" /><published>2017-05-08T00:00:00-04:00</published><updated>2017-05-08T00:00:00-04:00</updated><id>http://localhost:4000/blog/2017/05/08/0.3-release</id><content type="html" xml:base="http://localhost:4000/blog/2017/05/08/0.3-release/">&lt;!--
+<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.4.3">Jekyll</generator><link href="/feed.xml" rel="self" type="application/atom+xml" /><link href="/" rel="alternate" type="text/html" /><updated>2017-05-11T17:02:19-04:00</updated><id>/</id><entry><title type="html">Apache Arrow 0.3.0 Release</title><link href="/blog/2017/05/08/0.3-release/" rel="alternate" type="text/html" title="Apache Arrow 0.3.0 Release" /><published>2017-05-08T00:00:00-04:00</published><updated>2017-05-08T00:00:00-04:00</updated><id>/blog/2017/05/08/0.3-release</id><content type="html" xml:base="/blog/2017/05/08/0.3-release/">&lt;!--
 
 --&gt;
 
+&lt;p&gt;Translations: &lt;a href=&quot;/blog/2017/05/08/0.3-release-japanese/&quot;&gt;日本語&lt;/a&gt;&lt;/p&gt;
+
 &lt;p&gt;The Apache Arrow team is pleased to announce the 0.3.0 release of the
 project. It is the product of an intense 10 weeks of development since the
 0.2.0 release from this past February. It includes &lt;a href=&quot;https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0&quot;&gt;&lt;strong&gt;306 resolved JIRAs&lt;/strong&gt;&lt;/a&gt;
@@ -82,7 +84,7 @@ to adding Appveyor continuous integration for MSVC, we have also written guides
 for building from source on Windows: &lt;a href=&quot;https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md&quot;&gt;C++&lt;/a&gt; and &lt;a href=&quot;https://github.com/apache/arrow/blob/master/python/doc/source/development.rst&quot;&gt;Python&lt;/a&gt;.&lt;/p&gt;
 
 &lt;p&gt;For the first time, you can install the Arrow Python library on Windows from
-[conda-forge][31]:&lt;/p&gt;
+&lt;a href=&quot;https://conda-forge.github.io&quot;&gt;conda-forge&lt;/a&gt;:&lt;/p&gt;
 
 &lt;div class=&quot;language-shell highlighter-rouge&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;conda install pyarrow -c conda-forge
 &lt;/code&gt;&lt;/pre&gt;
@@ -165,7 +167,7 @@ additional data structures utilizing common IO and memory management tools.&lt;/
 &lt;h3 id=&quot;start-of-javascript-typescript-implementation&quot;&gt;Start of JavaScript (TypeScript) Implementation&lt;/h3&gt;
 
 &lt;p&gt;&lt;a href=&quot;https://github.com/TheNeuralBit&quot;&gt;Brian Hulette&lt;/a&gt; started developing an Arrow implementation in
-&lt;a href=&quot;https://conda-forge.github.io&quot;&gt;TypeScript&lt;/a&gt; for use in NodeJS and browser-side applications. We are
+&lt;a href=&quot;https://github.com/apache/arrow/tree/master/js&quot;&gt;TypeScript&lt;/a&gt; for use in NodeJS and browser-side applications. We are
 benefitting from Flatbuffers’ first class support for JavaScript.&lt;/p&gt;
 
 &lt;h3 id=&quot;improved-website-and-developer-documentation&quot;&gt;Improved Website and Developer Documentation&lt;/h3&gt;
@@ -208,4 +210,140 @@ instructions for getting started.&lt;/p&gt;
       1 Holden Karau
       1 Deepak Majeti
 &lt;/code&gt;&lt;/pre&gt;
+&lt;/div&gt;</content><author><name>wesm</name></author></entry><entry><title type="html">Apache Arrow 0.3.0リリース</title><link href="/blog/2017/05/08/0.3-release-japanese/" rel="alternate" type="text/html" title="Apache Arrow 0.3.0リリース" /><published>2017-05-08T00:00:00-04:00</published><updated>2017-05-08T00:00:00-04:00</updated><id>/blog/2017/05/08/0.3-release-japanese</id><content type="html" xml:base="/blog/2017/05/08/0.3-release-japanese/">&lt;!--
+
+--&gt;
+
+&lt;p&gt;&lt;a href=&quot;/blog/2017/05/08/0.3-release/&quot;&gt;原文(English)&lt;/a&gt;&lt;/p&gt;
+
+&lt;p&gt;Apache Arrowチームは0.3.0のリリースをアナウンスできてうれしいです。2月にリリースした0.2.0から10週間の活発な開発の結果が今回のリリースです。&lt;a href=&quot;https://github.com/apache/arrow/graphs/contributors&quot;&gt;&lt;strong&gt;23人のコントリビューター&lt;/strong&gt;&lt;/a&gt;が&lt;a href=&quot;https://issues.apache.org/jira/issues/?jql=project%20%3D%20ARROW%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND%20fixVersion%20%3D%200.3.0&quot;&gt;&lt;strong&gt;306個のJIRAのissueを解決&lt;/strong&gt;&lt;/a&gt;しました。&lt;/p&gt;
+
+&lt;p&gt;複数のArrowの実装にたくさんの新しい機能を追加しています。2017年、特に注力して開発するのは、インメモリー用のフォーマット、型のメタデータ、メッセージング用のプロトコルです。これは、ビッグデータアプリケーションに&lt;strong&gt;安定していてプロダクションで使える基盤&lt;/strong&gt;を提供するためです。高性能IOとインメモリーデータ処理にArrowを活用するために、&lt;a href=&quot;http://spark.apache.org&quot;&gt;Apache Spark&lt;/a&gt;・&lt;a href=&quot;http://www.geomesa.org/&quot;&gt;GeoMesa&lt;/a&gt;コミュニティーと協力していてとてもエキサイティングです。&lt;/p&gt;
+
+&lt;p&gt;それぞれのプラットフォームでArrowを使う方法は&lt;a href=&quot;http://arrow.apache.org/install&quot;&gt;インストールページ&lt;/a&gt;を見てください。&lt;/p&gt;
+
+&lt;p&gt;Arrowでビッグデータシステムを高速化するケースを増やすために、近いうちにApache Arrowのロードマップを公開する予定です。&lt;/p&gt;
+
+&lt;p&gt;Arrowの開発に参加するコントリビューターを募集しています。すでにArrowの開発に参加しているコミュニティーからのコントリビューターもそうですし、まだ参加していないGo、R、Juliaといったコミュニティーからのコントリビューターも募集しています。&lt;/p&gt;
+
+&lt;h3 id=&quot;ファイルフォーマットとストリーミングフォーマットの強化&quot;&gt;ファイルフォーマットとストリーミングフォーマットの強化&lt;/h3&gt;
+
+&lt;p&gt;0.2.0では&lt;strong&gt;ランダムアクセス&lt;/strong&gt;用と&lt;strong&gt;ストリーミング&lt;/strong&gt;用のArrowのワイヤーフォーマットを導入しました。実装の詳細は&lt;a href=&quot;http://arrow.apache.org/docs/ipc.html&quot;&gt;IPC仕様&lt;/a&gt;を見てください。ユースケースは&lt;a href=&quot;http://wesmckinney.com/blog/arrow-streaming-columnar/&quot;&gt;使用例を紹介したブログ&lt;/a&gt;を見てください。これらのフォーマットを使うと低オーバーヘッド・コピーなしでArrowのレコードバッチのペイロードにアクセスできます。&lt;/p&gt;
+
+&lt;p&gt;0.3.0ではこのバイナリーフォマットの細かい詳細をたくさん固めました。Java、C++、Python間の連携のテストおよびそれぞれ言語での単体テストの整備も進めました。&lt;a href=&quot;http://github.com/google/flatbuffers&quot;&gt;Google Flatbuffers&lt;/a&gt;は、前方互換性を壊さずにメタデータに新しい機能を追加するのに非常に助かりました。&lt;/p&gt;
+
+&lt;p&gt;まだバイナリーフォーマットの前方互換性を必ず壊さないと約束できる状態ではありませんが(もしかしたら変更する必要があるなにかが見つかるかもしれない)、メジャーリリース間では不必要に互換性を壊さないように努力するつもりです。Apache ArrowのWebサイト、各コンポーネントのユーザー向けのドキュメントおよびAPIドキュメントへのコントリビューションを非常に歓迎します。&lt;/p&gt;
+
+&lt;h3 id=&quot;辞書エンコーディングのサポート&quot;&gt;辞書エンコーディングのサポート&lt;/h3&gt;
+
+&lt;p&gt;&lt;a href=&quot;http://www.geomesa.org/&quot;&gt;GeoMesa&lt;/a&gt;プロジェクトの&lt;a href=&quot;https://github.com/elahrvivaz&quot;&gt;Emilio Lahr-Vivaz&lt;/a&gt;はJavaのArrow実装に辞書エンコード対応ベクターをコントリビュートしました。これを受けて、C++とPythonでもサポートしました。(&lt;code class=&quot;highlighter-rouge&quot;&gt;pandas.Categorical&lt;/code&gt;とも連携できます。)辞書エンコーディング用のインテグレーションテスト(C++とJava間でこのデータを送受信するテスト)はまだ完成していませんが、0.4.0までには完成させたいです。&lt;/p&gt;
+
+&lt;p&gt;これはカテゴリーデータ用の一般的なデータ表現テクニックです。これを使うと、複数のレコードバッチで共通の「辞書」を共有し、各レコードバッチの値はこの辞書を参照する整数になります。このデータは統計的言語(statistical language)の分野では「カテゴリー(categorical)」や「因子(factor)」と呼ばれています。Apache Parquetのようなファイルフォーマットの分野ではデータ圧縮のためだけに使われています。&lt;/p&gt;
+
+&lt;h3 id=&quot;日付時刻固定長型の拡張&quot;&gt;日付、時刻、固定長型の拡張&lt;/h3&gt;
+
+&lt;p&gt;0.2.0では現実に使われている日付・時刻型をインテグレーションテスト付きで完全にサポートすることを諦めました。これらは&lt;a href=&quot;http://parquet.apache.org&quot;&gt;Apache Parquet&lt;/a&gt;とApache Sparkとの連携に必要な機能です。&lt;/p&gt;
+
+&lt;ul&gt;
+  &lt;li&gt;&lt;strong&gt;日付&lt;/strong&gt;: 32-bit(日単位)と64-bit(ミリ秒単位)&lt;/li&gt;
+  &lt;li&gt;&lt;strong&gt;時刻&lt;/strong&gt;: 単位付き64-bit整数(単位:秒、ミリ秒、マイクロ秒、ナノ秒)&lt;/li&gt;
+  &lt;li&gt;&lt;strong&gt;タイムスタンプ(UNIXエポックからの経過時間)&lt;/strong&gt;: 単位付き64-bit整数のタイムゾーン付きとタイムゾーンなし&lt;/li&gt;
+  &lt;li&gt;&lt;strong&gt;固定長バイナリー&lt;/strong&gt;: 決まったバイト数のプリミティブな値&lt;/li&gt;
+  &lt;li&gt;&lt;strong&gt;固定長リスト&lt;/strong&gt;: 各要素が同じサイズのリスト(要素のベクターとは別にオフセットのベクターを持つ必要がない)&lt;/li&gt;
+&lt;/ul&gt;
+
+&lt;p&gt;C++のArrow実装では、&lt;a href=&quot;https://github.com/boostorg/multiprecision&quot;&gt;Boost.Multiprecision&lt;/a&gt;を使ったexactな小数のサポートを実験的に追加しました。ただし、Java実装とC++実装間での小数のメモリーフォーマットはまだ固まっていません。&lt;/p&gt;
+
+&lt;h3 id=&quot;cとpythonのwindowsサポート&quot;&gt;C++とPythonのWindowsサポート&lt;/h3&gt;
+
+&lt;p&gt;一般的なC++とPythonでの開発用に、パッケージ周りの改良も多数入っています。0.3.0はVisual Studio(MSVC)2015と2017を使ってWindowsを完全にサポートした最初のバージョンです。AppveyorでMSVC用のCIを実行しています。Windows上でソースからビルドするためのガイドも書きました。&lt;a href=&quot;https://github.com/apache/arrow/blob/master/cpp/doc/Windows.md&quot;&gt;C++&lt;/a&gt;用と&lt;a href=&quot;https://github.com/apache/arrow/blob/master/python/doc/source/development.rst&quot;&gt;Python&lt;/a&gt;用。&lt;/p&gt;
+
+&lt;p&gt;&lt;a href=&quot;https://conda-forge.github.io&quot;&gt;conda-forge&lt;/a&gt;からWindows用のArrowのPythonライブラリーをインストールできます。&lt;/p&gt;
+
+&lt;div class=&quot;language-shell highlighter-rouge&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;conda install pyarrow -c conda-forge
+&lt;/code&gt;&lt;/pre&gt;
+&lt;/div&gt;
+
+&lt;h3 id=&quot;cglibバインディングとrubylua他のサポート&quot;&gt;C(GLib)バインディングとRuby・Lua・他のサポート&lt;/h3&gt;
+
+&lt;p&gt;&lt;a href=&quot;http://github.com/kou&quot;&gt;Kouhei Sutou&lt;/a&gt;は新しいApache Arrowのコントリビューターです。Linux用の(ArrowのC++実装の)GLibを使ったCバインディングをコントリビュートしました。&lt;a href=&quot;https://wiki.gnome.org/Projects/GObjectIntrospection&quot;&gt;GObject Introspection&lt;/a&gt;というCのミドルウェアを使うことでRuby、Lua、Goや&lt;a href=&quot;https://wiki.gnome.org/Projects/GObjectIntrospection/Users&quot;&gt;他にも様々なプログラミング言語&lt;/a&gt;でシームレスにバインディングを使うことができます。これらのバインディングがどのように動いているか、これらのバインディングをどのように使うかを説明するブログ記事が別途必要な気がします。&lt;/p&gt;
+
+&lt;h3 id=&quot;pysparkを使ったapache-sparkとの連携&quot;&gt;PySparkを使ったApache Sparkとの連携&lt;/h3&gt;
+
+&lt;p&gt;&lt;a href=&quot;https://issues.apache.org/jira/browse/SPARK-13534&quot;&gt;SPARK-13534&lt;/a&gt;でApache Sparkコミュニティーと協力しています。PySparkでの&lt;code class=&quot;highlighter-rouge&quot;&gt;DataFrame.toPandas&lt;/code&gt;をArrowを使って高速化しようとしています。効率的なデータのシリアライズにより&lt;a href=&quot;https://github.com/apache/spark/pull/15821#issuecomment-282175163&quot;&gt;&lt;strong&gt;40倍以上高速化&lt;/strong&gt;&lt;/a&gt;できるケースがあります。&lt;/p&gt;
+
+&lt;p&gt;PySparkでArrowを使うことでこれまでできなかったパフォーマンス最適化の道が開けました。特に、UDFの評価まわりでいろいろやれることがあるでしょう。(たとえば、Pythonのラムダ関数を使って&lt;code class=&quot;highlighter-rouge&quot;&gt;map&lt;/code&gt;・&lt;code class=&quot;highlighter-rouge&quot;&gt;filter&lt;/code&gt;を実行するケース。)&lt;/p&gt;
+
+&lt;h3 id=&quot;python実装での新しい機能メモリービューfeatherapache-parquetのサポート&quot;&gt;Python実装での新しい機能:メモリービュー、Feather、Apache Parquetのサポート&lt;/h3&gt;
+
+&lt;p&gt;ArrowのPythonライブラリーである&lt;code class=&quot;highlighter-rouge&quot;&gt;pyarrow&lt;/code&gt;は&lt;code class=&quot;highlighter-rouge&quot;&gt;libarrow&lt;/code&gt;と&lt;code class=&quot;highlighter-rouge&quot;&gt;libarrow_python&lt;/code&gt;というC++ライブラリーのCythonバインディングです。&lt;code class=&quot;highlighter-rouge&quot;&gt;pyarrow&lt;/code&gt;はNumPyと&lt;a href=&quot;http://pandas.pydata.org&quot;&gt;pandas&lt;/a&gt;とPythonの標準ライブラリー間のシームレスな連携を実現します。&lt;/p&gt;
+
+&lt;p&gt;ArrowのC++ライブラリーで最も重要なものは&lt;code class=&quot;highlighter-rouge&quot;&gt;arrow::Buffer&lt;/code&gt;オブジェクトです。これはメモリービューを管理します。コピーなしの読み込みとスライスをサポートしている点が重要です。&lt;a href=&quot;https://github.com/JeffKnupp&quot;&gt;Jeff Knupp&lt;/a&gt;はArrowのバッファーとPythonのバッファープロトコルとmemoryviewの連携処理をコントリビュートしました。これにより次のようなことができるようになりました。&lt;/p&gt;
+
+&lt;div class=&quot;language-python highlighter-rouge&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;&lt;span class=&quot;n&quot;&gt;In&lt;/span&gt; &lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;6&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;kn&quot;&gt;import&lt;/span&gt; &lt;span class=&quot;nn&quot;&gt;pyarrow&lt;/span&gt; &lt;span class=&quot;kn&quot;&gt;as&lt;/span&gt; &lt;span class=&quot;nn&quot;&gt;pa&lt;/span&gt;
+
+&lt;span class=&quot;n&quot;&gt;In&lt;/span&gt; &lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;7&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;buf&lt;/span&gt; &lt;span class=&quot;o&quot;&gt;=&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;pa&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;.&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;frombuffer&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;(&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;b&lt;/span&gt;&lt;span class=&quot;s&quot;&gt;'foobarbaz'&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;)&lt;/span&gt;
+
+&lt;span class=&quot;n&quot;&gt;In&lt;/span&gt; &lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;8&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;buf&lt;/span&gt;
+&lt;span class=&quot;n&quot;&gt;Out&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;8&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;o&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;pyarrow&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;.&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;_io&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;.&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;Buffer&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;at&lt;/span&gt; &lt;span class=&quot;mh&quot;&gt;0x7f6c0a84b538&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;&amp;gt;&lt;/span&gt;
+
+&lt;span class=&quot;n&quot;&gt;In&lt;/span&gt; &lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;9&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;memoryview&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;(&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;buf&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;)&lt;/span&gt;
+&lt;span class=&quot;n&quot;&gt;Out&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;9&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;o&quot;&gt;&amp;lt;&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;memory&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;at&lt;/span&gt; &lt;span class=&quot;mh&quot;&gt;0x7f6c0a8c5e88&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;&amp;gt;&lt;/span&gt;
+
+&lt;span class=&quot;n&quot;&gt;In&lt;/span&gt; &lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;10&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;buf&lt;/span&gt;&lt;span class=&quot;o&quot;&gt;.&lt;/span&gt;&lt;span class=&quot;n&quot;&gt;to_pybytes&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;()&lt;/span&gt;
+&lt;span class=&quot;n&quot;&gt;Out&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;[&lt;/span&gt;&lt;span class=&quot;mi&quot;&gt;10&lt;/span&gt;&lt;span class=&quot;p&quot;&gt;]:&lt;/span&gt; &lt;span class=&quot;n&quot;&gt;b&lt;/span&gt;&lt;span class=&quot;s&quot;&gt;'foobarbaz'&lt;/span&gt;
+&lt;/code&gt;&lt;/pre&gt;
+&lt;/div&gt;
+
+&lt;p&gt;C++でのParquet実装である&lt;a href=&quot;https://github.com/apache/parquet-cpp&quot;&gt;parquet-cpp&lt;/a&gt;を使うことで大幅に&lt;a href=&quot;http://parquet.apache.org&quot;&gt;&lt;strong&gt;Apache Parquet&lt;/strong&gt;&lt;/a&gt;サポートを改良しました。たとえば、ディスク上にあるかHDFS上にあるか関係なく、パーティションされたデータセットをサポートしました。&lt;a href=&quot;https://github.com/dask/dask/commit/68f9e417924a985c1f2e2a587126833c70a2e9f4&quot;&gt;Daskプロジェクト&lt;/a&gt;はArrowを使ったParquetサポートを実装した最初のプロジェクトです。Dask開発者とはpandsデータを分散処理する文脈でさらに協力できることを楽しみにしています。&lt;/p&gt;
+
+&lt;p&gt;pandasを成熟させるためにArrowを改良することもあり、&lt;a href=&quot;https://github.com/wesm/feather&quot;&gt;&lt;strong&gt;Featherフォーマット&lt;/strong&gt;&lt;/a&gt;の実装をマージしたのもその1つです。Featherフォーマットは本質的にはArrowのランダムアクセスフォーマットの特別なケースの1つです。ArrowのコードベースでFeatherの開発を続けます。たとえば、今のFeatherはArrowのPythonバインディングのレイヤーを使うことでPythonのファイルオブジェクトを読み書きできるようになっています。&lt;/p&gt;
+
+&lt;p&gt;&lt;code class=&quot;highlighter-rouge&quot;&gt;DatetimeTZ&lt;/code&gt;や&lt;code class=&quot;highlighter-rouge&quot;&gt;Categorical&lt;/code&gt;といったpandas固有のデータ型のちゃんとした(robust)サポートも実装しました。&lt;/p&gt;
+
+&lt;h3 id=&quot;cライブラリーでのテンソルサポート&quot;&gt;C++ライブラリーでのテンソルサポート&lt;/h3&gt;
+
+&lt;p&gt;Apache Arrowはコピーなしで共有メモリーを管理するツールという側面があります。機械学習アプリケーションの文脈でこの機能への関心が増えています。UCバークレー校の&lt;a href=&quot;https://rise.cs.berkeley.edu/&quot;&gt;RISELab&lt;/a&gt;の&lt;a href=&quot;https://github.com/ray-project/ray&quot;&gt;Rayプロジェクト&lt;/a&gt;が最初の例です。&lt;/p&gt;
+
+&lt;p&gt;機械学習ではは「テンソル」とも呼ばれる多次元配列というデータ構造を扱います。このようなデータ構造はArrowのカラムフォーマットがサポートしているデータ構造の範囲を超えています。今回のケースでは、&lt;a href=&quot;http://arrow.apache.org/docs/cpp/classarrow_1_1_tensor.html&quot;&gt;&lt;code class=&quot;highlighter-rouge&quot;&gt;arrow::Tensor&lt;/code&gt;&lt;/a&gt;というC++の型を追加で実装しました。これはArrowのコピーなしの共有メモリー機能を活用して実装しました。(メモリーの生存期間の管理に&lt;code class=&quot;highlighter-rouge&quot;&gt;arrow::Buffer&lt;/code&gt;を使いました。)C++実装では、これからも、共通のIO・メモリー管理ツールとしてArrowを活用できるようにするため、追加のデータ構造を提供するつもりです。&lt;/p&gt;
+
+&lt;h3 id=&quot;javascripttypescript実装の開始&quot;&gt;JavaScript(TypeScript)実装の開始&lt;/h3&gt;
+
+&lt;p&gt;&lt;a href=&quot;https://github.com/TheNeuralBit&quot;&gt;Brian Hulette&lt;/a&gt;はNodeJSとWebブラウザー上で動くアプリケーションで使うために&lt;a href=&quot;https://github.com/apache/arrow/tree/master/js&quot;&gt;TypeScript&lt;/a&gt;でのArrowの実装を始めました。FlatBuffersがJavaScriptをファーストクラスでサポートしているので実装が捗ります。&lt;/p&gt;
+
+&lt;h3 id=&quot;webサイトと開発者用ドキュメントの改良&quot;&gt;Webサイトと開発者用ドキュメントの改良&lt;/h3&gt;
+
+&lt;p&gt;0.2.0をリリースしてからドキュメントとブログを公開するためにWebサイトのシステムを&lt;a href=&quot;https://jekyllrb.com&quot;&gt;Jekyll&lt;/a&gt;ベースで作りました。Kouhei Sutouは&lt;a href=&quot;https://github.com/red-data-tools/jekyll-jupyter-notebook&quot;&gt;Jekyll Jupyter Notebookプラグイン&lt;/a&gt;を作りました。これによりArrowのWebサイトのコンテンツを作るためにJupyterを使うことができます。&lt;/p&gt;
+
+&lt;p&gt;WebサイトにはC、C++、Java、PythonのAPIドキュメントを公開しました。これらの中にArrowを使い始めるための有益な情報を見つけられるでしょう。&lt;/p&gt;
+
+&lt;h3 id=&quot;コントリビューター&quot;&gt;コントリビューター&lt;/h3&gt;
+
+&lt;p&gt;このリリースにパッチをコントリビュートしたみなさんに感謝します。&lt;/p&gt;
+
+&lt;div class=&quot;highlighter-rouge&quot;&gt;&lt;pre class=&quot;highlight&quot;&gt;&lt;code&gt;$ git shortlog -sn apache-arrow-0.2.0..apache-arrow-0.3.0
+    119 Wes McKinney
+     55 Kouhei Sutou
+     18 Uwe L. Korn
+     17 Julien Le Dem
+      9 Phillip Cloud
+      6 Bryan Cutler
+      5 Philipp Moritz
+      5 Emilio Lahr-Vivaz
+      4 Max Risuhin
+      4 Johan Mabille
+      4 Jeff Knupp
+      3 Steven Phillips
+      3 Miki Tebeka
+      2 Leif Walsh
+      2 Jeff Reback
+      2 Brian Hulette
+      1 Tsuyoshi Ozawa
+      1 rvernica
+      1 Nong Li
+      1 Julien Lafaye
+      1 Itai Incze
+      1 Holden Karau
+      1 Deepak Majeti
+&lt;/code&gt;&lt;/pre&gt;
 &lt;/div&gt;</content><author><name>wesm</name></author></entry></feed>
\ No newline at end of file

http://git-wip-us.apache.org/repos/asf/arrow-site/blob/3a7bab25/install/index.html
----------------------------------------------------------------------
diff --git a/install/index.html b/install/index.html
index 75ed13a..8a1d1d1 100644
--- a/install/index.html
+++ b/install/index.html
@@ -100,7 +100,11 @@
   </nav>
 
 
-    <h2 id="current-version-030">Current Version: 0.3.0</h2>
+    <!--
+
+-->
+
+<h2 id="current-version-030">Current Version: 0.3.0</h2>
 
 <h3 id="released-5-may-2017">Released: 5 May 2017</h3>
 
@@ -149,6 +153,74 @@ conda install pyarrow -c conda-forge
 <p>These include the Apache Arrow and Apache Parquet C++ binary libraries bundled
 with the wheel.</p>
 
+<h3 id="c-and-glib-c-packages-for-debian-gnulinux-ubuntu-and-centos-unofficial">C++ and GLib (C) Packages for Debian GNU/Linux, Ubuntu and CentOS (Unofficial)</h3>
+
+<p>We have provided APT and Yum repositories for Apache Arrow C++ and
+Apache Arrow GLib (C). Here are supported platforms:</p>
+
+<ul>
+  <li>Debian GNU/Linux Jessie</li>
+  <li>Ubuntu 16.04 LTS</li>
+  <li>Ubuntu 16.10</li>
+  <li>Ubuntu 17.04</li>
+  <li>CentOS 7</li>
+</ul>
+
+<p>Debian GNU/Linux Jessie:</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>sudo apt update
+sudo apt install -y -V apt-transport-https
+cat <span class="sh">&lt;&lt;APT_LINE | sudo tee /etc/apt/sources.list.d/groonga.list
+deb https://packages.groonga.org/debian/ jessie main
+deb-src https://packages.groonga.org/debian/ jessie main
+APT_LINE
+</span>sudo apt update
+sudo apt install -y -V --allow-unauthenticated groonga-keyring
+sudo apt update
+sudo apt install -y -V libarrow-dev <span class="c"># For C++</span>
+sudo apt install -y -V libarrow-glib-dev <span class="c"># For GLib (C)</span>
+</code></pre>
+</div>
+
+<p>Ubuntu:</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>sudo apt install -y software-properties-common
+sudo add-apt-repository -y ppa:groonga/ppa
+sudo apt update
+sudo apt install -y -V libarrow-dev <span class="c"># For C++</span>
+sudo apt install -y -V libarrow-glib-dev <span class="c"># For GLib (C)</span>
+</code></pre>
+</div>
+
+<p>CentOS:</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>sudo yum install -y https://packages.groonga.org/centos/groonga-release-1.3.0-1.noarch.rpm
+sudo yum install -y --enablerepo<span class="o">=</span>epel arrow-devel <span class="c"># For C++</span>
+sudo yum install -y --enablerepo<span class="o">=</span>epel arrow-glib-devel <span class="c"># For GLib (C)</span>
+</code></pre>
+</div>
+
+<p>These repositories also provide Apache Parquet C++ and
+<a href="https://github.com/red-data-tools/parquet-glib">Parquet GLib</a>. You can install them by the followings:</p>
+
+<p>Debian GNU/Linux and Ubuntu:</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>sudo apt install -y -V libparquet-dev <span class="c"># For Apache Parquet C++</span>
+sudo apt install -y -V libparquet-glib-dev <span class="c"># For Parquet GLib (C)</span>
+</code></pre>
+</div>
+
+<p>CentOS:</p>
+
+<div class="language-shell highlighter-rouge"><pre class="highlight"><code>sudo yum install -y --enablerepo<span class="o">=</span>epel parquet-devel <span class="c"># For Apache Parquet C++</span>
+sudo yum install -y --enablerepo<span class="o">=</span>epel parquet-glib-devel <span class="c"># For Parquet GLib (C)</span>
+</code></pre>
+</div>
+
+<p>These repositories are managed at
+<a href="https://github.com/red-data-tools/arrow-packages">red-data-tools/arrow-packages</a>. If you have any feedback, please
+send it to the project instead of Apache Arrow project.</p>
+
 
 
     <hr/>