といっても、何時間もパソコンには張り付いているわけではなく1週間に1回のペースで商品のメンテナンスを行なっている。1週間に1回、時間にすれば1時間程度の事務作業になるのだが、データマイニングツールによって生成された商品データベースを主に管理する程度なので、1つ1つ商品を作成しているのではない。
ちなみに、中古マーケットに掲載した商品はeBay出品プラグインを同時平行で運用しており、現在300点ほどの商品をeBayにも同時出品している。eBayに露出することで多くのユーザーにDiscovery Japanの存在自体をアピールすることが可能になる。
日本語自社サイトのまま海外販売サイトを作る実験を仮説してみた
和菓子が最近食べたくなったので、和菓子のサイトを海外販売する例で考えてみたい。
以下のサイトは婦人画報という洋菓子や和菓子を取り扱ったサイトで、和菓子 ネット通販 というキーワードでヒットしたので、これを対象にしてみたい。(対象にするサイトは、日本語の通販サイトであれば、別になんでも良い。)
このサイトのカテゴリをクリックすると、URL構造に&や?が混在することから、URLのリクエストに応じて動的にコンテンツを生成するウェブサイトということがわかる。
トップページ
カテゴリページ
カテゴリページのURL末尾には 0-7232-7301 このような数字が並んでおり、この数字はデータベースなどで管理されているカテゴリIDの一部だと思われる。このページから、カテゴリに含まれる商品のURLを取得することができる。
商品ページ
商品ページのURLは
http://fujingaho.ringbell.co.jp/index.php/module/ShohinShosai/action/ShohinShosai/shohin/83340となっており、末尾の83440が商品IDだと思われる。Googleで以下のコマンドで検索をすると、
site:fujingaho.ringbell.co.jp/index.php/module/ShohinShosai/action/ShohinShosai/shohin/*約1210件ヒットすることから、このサイトの商品数は1210件あり、この1210件をLive Commerce用のデータ構造にするデータマイニング、実際にはGoogleが行なっているようなデータスクレイピングを行う。この作業までは力仕事となるが、データマイニングができる状態になればこの約1200件の商品データベースが構築され、このデータベースが1日1回自動で更新されるバッチ処理までをクラウド上で行う。
ここまで行うと、このサイトは高度なAPI通信も可能で、あとはデスクトップ上の事務作業レベルでDiscovery Japan へのインテグレーションは簡単だ。
ちなみに、日本語を英語に翻訳するタスクについては
などがあるが、機械翻訳は未だにトンデモ翻訳になる可能性もあるので、2と3を選択することになるが、全て人力で行うとそれなりのコストにはなるので、近年でてきた機械翻訳と人力翻訳の両方をいいとこ取りをしたハイブリッド翻訳などはいいだろう。