Cloud Nextで発表されたBigQuery MLを使って、ボストン住宅価格予測をやってみます。 BigQuery ML Cloud Next’18 のKeynoteで発表された、BigQueryのSQLクエリ内で機械学習モデルの学習/推論ができる機能です。 ドキュメントはこちら 特徴としては、 BigQuer…
最近、Kubernetes(k8s)盛り上がってますね。 KubernetesといえばMicroservice、というイメージでしたが、 意外と機械学習系のプロダクト開発と相性がいいのではないかと思うようになり、 しっかり勉強することにしました。 Kubernetes + 機械学習といえば、…
Rundeck はジョブヒストリーを定期自動パージできないという問題があり、 いつの間にか数万エントリーになっていたりするので、作りました、という告知 github.com
pyenv + virtualenvの問題点 Pythonでの開発環境において、 開発ホスト上に複数のバージョンのPythonをインストールしたい場合 … pyenv プロジェクトごとに仮想環境を構築し、モジュールを切り替えたい場合 … virtualenv の2つの組み合わせは一般的に使われ…
この記事は、Elastic stack Advent Calendar 2016の11日目の記事です。 Elasticsearch クラスタを1.7 から 5.0.2まで上げたときに、それなりに変更点が多く、苦労しました。 本記事では、そのときのノウハウを元に、 1.xを使っていて、5.xに上げたいと思って…
特定のサイトにつながらない 前記事で設定したVPNサーバーを経由した場合に、特定の一部サイト(github.com, yahoo.com)にアクセスできないことがわかった。 現象としては、 ping は通るが、80ポートの返答がない https, httpなどプロトコルにはよらない VPN…
基本的な手順は参考元サイトをもとに構築していく。 想定クライアント iOS: > 10 OS X: > El Capitan ※今回、最終的にユーザー名・パスワード認証は成功しているが、公開鍵認証はiOS, OS Xのネイティブクライアントで動作できていない。 OSX側の問題の可能性…
iOS10からPPTPクライアントが廃止されてしまい、 家のバッファロールータで動いていたPPTPサーバにアクセスできなくなってしまったので、この際きちんとVPNサーバーを立ててみる。 まずはVPNの方式について調査。 VPN方式の違い PPTP 古くからある方式だが、…
Docker on vagrant Dockerをvagrant上に構築してみる。 ネット上の情報を参考にしてみてもうまくいかなかったので、だいぶ試行錯誤した 目指す構成は以下のとおり Docker Container (CentOS6) on Vagrant (CentOS6) on Windows 10 ※今回はHadoopクラスタ構築…
サーバー上での作業途中など、普段の業務メモは手元のエディタにmarkdown表記で記録している。 ところが、技術系の資料はConfluenceにまとめることになっているため、作業終了後はmarkdownで書いた記録を、再度Confluence上で作成しなおすことになる。 そのC…
社内のチームで数十台~のサーバーを管理していて、その上でElasticSearchやHadoopを構築している。 これまで、そのクラスタのオペレーションをほぼ手作業なりシェルスクリプトでやっていて、 手順の再利用性もないし何よりめんどくさいので、 何か自動化で…
Gangliaにカスタムモジュールを入れてHDDの温度監視をしてみる。 前提 CentOS 7.1 Gangalia 3.7 セキュリティを重視していないので、実験用環境での使用を想定しています Package インストール python モジュールで拡張するので、以下のパッケージをインスト…
docker1.9のoverlay networkを試すにはLinux kernel3.16が必要だが、CentOS7では3.10までしか提供されていない。 kernelの更新はelrepoを使えば簡単にできるようなので試してみた。 注意: kernelの更新は危険なオペレーションのため、壊れても良い環境で試し…
Rundeckをジョブスケジューラとして使い始めて、メールをGmail経由で送れるようにした。 OSはCentOS7だが、他でも変わらないはず。 Rundeckのインストール インストールは難しくない。yumで入るはず。 起動もsystemctl start rundeckd.serviceでできる。 詳…
どこにも情報がなかったのでメモ Windows7からWindows10にアップグレードしたところLogitecのBluethoothアダプタが使えなくなった。 どうやらドライバがうまく認識されていないらしいが、Logitecでも対応ドライバはないようだ。 要はCSRのドライバを削除して…
手順 Centos7用のrpmを使った手順もある(https://docs.docker.com/installation/centos/)が、 以下の公式ドキュメントの方法を使うほうが楽そう。 http://docs.docker.com/linux/started/ この手順でもrpmがインストールされるので、管理も楽。 # 公式の手…
Pythonの仮想環境ツールがいろいろありすぎて混乱するので、整理目的で調査してみる。 ざっと調べた感じでは以下のとおり。 Pyenv 複数バージョンのPythonバイナリを管理するもの。プロジェクト(ディレクトリ)単位での異なるバージョンのPythonが使用できる…
file sourceを開いた時に、これまではデフォルトでカレントディレクトリが入力された状態であったが、下記のコミットでこれができなくなってしまった。 どうすればいいんだろう https://github.com/Shougo/unite.vim/commit/0d8336a4e6036f6100050fa0455896a…
Homebrewでいろいろインストールできない homebrewで"failed to download"なエラーが頻発しており、lvすらもインストールできない始末。 これの原因がわかったのでメモ。 ついでにChromeでwikipediaを見ると"ERR_EMPTY_RESPONSE"になる件も原因は一緒だった…
graph-tool 前回NetworkXを使ってグラフを描画したが、主に使用目的がpythonでのデータの可視化であったので、それに特化したライブラリを探していた。 そこで見つけたのがgraph-tool。graph-toolはデータビジュアライゼーションに特化したライブラリとのこ…
NetworkXを使ってみる pythonで100万オーダーのノードを持つネットワーク図を作成したいので、調べてみたところNetworkXというものが使えそう。 NetworkXの準備 Macでの実行なので、pipをインストールしていればすぐにセットアップできる sudo pip install n…
実行スクリプトからモジュールを呼び出す場合、モジュール内部からモジュール本体のパスを取得する方法。 単純にos.getcwd()を使うと実行スクリプトのカレントディレクトリを取得してしまう。 呼び出しているモジュール中で、モジュールのカレントディレクト…
MinGWのインストール方法がいつの間にか変更されていた。リポジトリを参照してパッケージ管理をするようになった。とりあえず20111118版はアンチウィルスソフトにはじかれるので、以前のバージョンをインストールして、インストール段階で最新のレポジトリを…
サーバー側で時間のかかる処理をする場合にプログレスバーを表示させたい。 重いメインの処理はGET+同期通信のレスポンスが返ってくる前に、GET+非同期通信で進行状況を取りたい。Firefox, Chrome, Safariで試したところFirefoxは同時に通信可能だったが、Ch…
Djangoではモデルの変更には対応できないのでSouth ( ver0.7 ) を導入。 できること: モデルのフィールドの変更? できないこと: モデル名の変更などモデルの同一性を判別できない以上、リネームは無理っぽいね。それなら手動でやったほうが早いし確実。
Visual Studio 2010でXerces XMLを使ってはまったのでメモ。プリプロセッサの前処理シンボルにXERCES_STATIC_LIBRARYを指定すること。指定しない場合、リンク時に未解決のシンボルエラーが発生する。以上。
1台のPCで並列処理を行う場合、openMP と MPI の2通りがあるらしい。 MPI はPCクラスタ上で実行する分散処理フレームワークだけれども、一台で実行する場合でもopenMP以上の性能が出る場合があるとのことなので、まずインストールをやってみた。1, MPICH2 o…
1台のPCで並列処理を行う場合、openMP と MPI の2通りがあるらしい。 MPI はPCクラスタ上で実行する分散処理フレームワークだけれども、一台で実行する場合でもopenMP以上の性能が出る場合があるとのことなので、まずインストールをやってみた。1, MPICH2 o…
PCで聴く場合はFlacで、iPhoneなどで聴く場合はaac,mp3みたいにいろんな形式で音楽ファイルを持っていると、いざFlac形式の音楽だけを聴きたい場合にしっくり管理する方法がなかった、ということは過去記事にも書いた。 でも、foobarならいろいろカスタマイ…
CDTでバイナリを実行してもコンソール上ですぐに[terminated]となってしまい実行できなくなった件:結論として、ライブラリが不足していると起こるらしい。スタックトレースには のように表示されるはず。一見コマンドプロンプトからは起動できていたので気…