Meblog

このブログ記事は個人の見解であり、所属する組織の公式見解ではありません

rubyを道具として使う

f:id:gntm_mdk:20170809205057j:plain

何か仕事を自動化したいときに、最近Rubyを多用するようになってきた。これは、今のプロジェクトでRuby on Railsを使っていることにも起因している。もちろんWindowsのバッチやLinuxシェルスクリプトでもいいんだけど、あえてRubyを使うことにメリットがあって、

  • 文法が明快。Windowsのバッチで複雑なことをさせるのは無理がある。。
  • Rubyのお勉強になる。

そんなわけで最近はもっぱらRubyなわけだ。

Thor

gemのThorを使い始めた。使い方や入門編は以下の記事が詳しい。
qiita.com


ThorはCUIアプリケーションのフレームワークだ。
毎回Rubyスクリプトを書くたびに、引数の処理を各々のスクリプトで個別に書いていたんだけど、これが以外と厄介だったのだ。Thorを使うと引数のパースをある程度やってくれるし、使い方のDescriptionを書くように設計されているので、簡易なドキュメンテーションもこれで十分だ。たとえ公開するつもりがなくても、何かメモしておかないと、自分ですら使い方を忘れてしまう)
ミニマムなサンプルは以下のとおりだ。

require 'thor'
class Command < Thor
  desc 'hello NAME', 'say hello to a given name'
  def hello (name)
    puts "hello, #{name}"
  end
end
Command.start

gemにする

これを以下の記事のとおりにgemにまとめ、社内のgitサーバに公開し、配布することもある。
qiita.com

こうすることで、ソースコード管理と配布を一元化できるし、バージョン管理も楽々になる。

gitサーバからgemインストールするには、bundlerを使うのがお手軽だ。一方でgem installのようにやりたければ、specific_install というgemでデフォルトのgemレポジトリ以外からインストールできる。一度導入すれば、bundlerを使うよりもお手軽だ。
github.com

とはいえ、ある程度のITリテラシが求められるよね、これじゃ.. そんなわけで、僕もまだ社内で啓蒙中だ。

gnuplot

こっちは割りと細かい話。

業務上よくあるのが、エクセルとの連携だ.. かならずどこかでエクセルによる作業がどうしても発生してしまう。確かにエクセルは便利なんだけど、大量にレコードがある場合、すぐにハングしてしまう(感覚的にいえば、1000行を超えるともう危ない。GUIが止まっているだけでしばらくするともとにもどることもあるが..)。また、ハングしなくとも、大量のシートやグラフを相手するときに、コピペ作業や、右クリックしてなんちゃらみたいな反復作業が非常に多く発生してしまう。プログラマにとってはいつまでたっても関わりたくない相手だと思う。

というわけで、なるべく作業フローからエクセルは排除したい。今まで表計算部分はcsvでなんとかすることができる。厄介なのはグラフ化だ。そんなときに便利だったのが、gnuplotのgemだった。
github.com


gnuplotは、ほとんど使ったことがない.. 大学でも、何やら複雑な関数のグラフ化はしたものの、実用上はあまりそういった使い方はせず、むしろcsvのプロットに使うわけで。Googleを検索しつつ、ぽちぽちとスクリプトを組んだ。

やってみると、タイムスタンプの処理なんかは割りと優秀で、案外使い勝手が良い。ただ、あまり色数が使えないのが玉にキズ。最近のエクセルのカラーパレットは小洒落ているからねえ。

ほかにもいろいろ

基本的に書捨てのアプリでもThorを使って書くようになった。社内Git(というより部内Gitサーバ)とはいえ、ちょっと全てを上げるのは気が引けるものばかりだ.. まあ、プライベートリポジトリにして他人からは見えなくするのアリだけどね(そもそもITリテラシが低くてGitがマトモに使うのは僕だけというのは内緒だ)。

org-mode で画面キャプチャをペタッとはりつける。

org-modeで画像貼り付けたい

org-mode使っていて、Evernoteなんかと比べたときに圧倒的に不便だな、と感じるのは、画像を取り扱っているときだ。さっくりメモをとったり、文章を構造化したりするときなんかには非常に役に立つのだが、何かの画像を切り貼りしたいときには、いちいち画像をimg配下なんかに保存して、そのパスを記述する、なんて面倒なことをしなければならない。

どうせ同じことで悩んでいる人がいるんだろうな、と思ってサーチしてみると、あっという間に見つかった。PCの画面キャプチャをorg-modeの画面にペタッと貼ってくれるelispだ。名前はそのままorg-attach-screenshot。

github.com

レポジトリ名はorg-screenshotだが、MELPAではorg-attach-screenshotで引き当てることができる。

M-x org-attach-screenshot で、適当にEnterを押下してると、Emacsがバックグラウンドになり、カーソルが十字になる。んで、範囲選択してキャプチャをとることができる。画像はデフォルトだと、編集中のorgファイルの下にdataフォルダが作成され、こんなかに入る仕組み。

これはこれで十分なんだけど、以下の点に不満が残った。

  • HTML出力するときに、画像がサムネイル化されない
  • Mac (OS-X)だと、imagemagickよりscreencaptureのほうがよさそう

改造

結論から言うと、ちょっと改造した。

github.com

差分は以下。

add thumbnail feature and adopt os-x. · medaka/org-screenshot@98ecee8 · GitHub

これで、HTML出力してみると、以下のような感じになる。

f:id:gntm_mdk:20170623004146p:plain

これだと普通だな。。オリジナルはサムネイル化されないんで、大きなキャプチャとると、全部はみでちゃうんよね。。

詳細

まあ、サムネイルに関してはいいでしょう。単に画像縮小してリンクはっただけ。

screencaputureに関して。オリジナルはimagemagickのimportっていうコマンドを用いてスクリーンをキャプチャするみたいなんだけど、同等の機能がOS-Xにはデフォルトでscreencaptureってのが入っている。importってのがサクっと動かなかったのと、screencaptureのほうがいちいちimagemagickを使わなくてすむということから、こちらに換装。

TODO

たぶんやらないであろうTODO

  • OSによって切り替え
  • サムネイル化するかのフラグを切り出す
  • サムネイル化したときの画像サイズを指定する変数を切り出す

終わったらプルリクエストを投げるのだ。

参考

実は更にオリジナルはるびきち氏のscreenshot.el。org-mode使わない人はこっちのほうがいいかも。

EmacsWiki: Screen Shot

アジャイルとハイプ

全体の工程にウォーターフォールモデルを採用しているプロジェクトも未だ多いと思う。

こういったプロジェクトでは、設計・製造工程(プログラミング工程のこと)のあと、何段階かの試験工程がある。試験工程ではブラックボックステストを多分に含み、要望元のユーザテストのようなものも含む。そうすると、当然基本的な設計に関わるような不満も噴出する。こういった機能がほしいだの、ボタンはこういう配置がいいだの、そういう要望だ。

こういった意見はくだらないものもあるが、なかには耳が痛いものも多い。当然対応すべきだった事を指摘されることもあり、エンジニアとしては是非対応したいところだ。しかし、試験工程に移った段階で開発要員は絞られており、残ったリソースで修正するのは容易ではない。そもそもウォーターフォールの概念から言うと、禁じ手でもある。なぜなら、ウォーターフォールにおける各工程の終了とは、その段階での完璧な品質の担保を意味しているため、要望による修正は、全ての工程をやりなおしを意味するからだ。幾度となく言われていることであるが、これがウォーターフォールの最大の欠点である。

すると当然、アジャイルを導入するか、という話が持ち上がってくる。

simplearchitect.hatenablog.com

アジャイルであれば、途中の要件変更に強くなるはずだ、という目論見である。アジャイル自体もう新しい技術でなくなっているし、コンサバティブな職場でも幾度となく検討されていることだろう。しかしこれも何度となく挫折を味わうことになる。最近携わったアジャイル開発も例外ではなかった。この失敗は、人員の問題や企業風土の問題も確かに少なからずある。しかし、今回言及したいのは、それ以外の部分、「ハイプ」だ。

        • -

ウォータフォールでは全ての機能を完全な仕様書におとしこみ、それを開発が順次実装していく。仕様書は開発工程開始時点では完璧であるはずなので、これをどれだけ忠実に実装していくかが問われるわけだ。しかしひとたびこれを「アジャイル」にしてみると、企画からしてみると、開発開始時点で仕様書は完成してなくてもよい、という解釈になる。企画からの要望はずるずると開発終盤まで変更される。開発終了時には、ぎりぎりまで要望変更の対応に追われるため、なんとか動くものはできる。しかし、品質も中途半端、工数も大きく膨らんでしまう。

企画が開発完了した製品を実際にテストする。すると、思った以上に齟齬が多いことにおどろく。齟齬を紐解こうと思っても開発途中には様々なバージョンの要求仕様書があり、どれが結論かも全く判然としないのだ(非エンジニアはいまだにバージョン管理には相当疎いことに留意しなければならない)。本来、いかなる開発においても、企画と開発が一体になっていない場合、ドキュメントは残すべきである。しかし、「アジャイル」という言葉を導入した途端、多大なコミュニケーションにより仕様を担保できると考えてしまい、完成したドキュメントはなくなってしまう。

簡単にいうならば

「なぜドキュメンテーションしなかったの?」
「アジャイル開発だったからです」

ということになる。アジャイルに過度に期待をよせてしまった「ハイプ」だ。

このハイプは、昨今の開発で、多く見られる現象のひとつのように感じる。例えばAIにしても中身や特徴、処理方法は別にして、とにかく「データ処理をうまくやってくれるもの」、VMは「サーバ上の処理をうまくやっていくれるもの」、先程のアジャイル開発はとにかく「開発工程をうまくやってくれるもの」、といった様にだ。ここでの教訓は肝心なのはハイプであるのは開発だけでなく、企画を始めとする間接部門にとってもハイプだということだ。開発には銀の弾などないということは、プロフェッショナルにとっては常識になっている。どれだけ便利な手法でもプラクティスを誤れば、全くうまくいかないアンチパターンになるリスクを孕んでいる。特に昨今の手法はこれさえやっておけばうまくいく、といった簡単なものではなくなっている。自分たちの状況に合わせたプラクティスの選択・構築が何より重大な命題になっていくだろう。この問題は、非エンジニアに説明するのは相当難しい。例えばアジャイルにとっても開発時のステークホルダーのスコープはどれだけか、開発規模はどの程度か、どの仕様が最低限必要なのか(これが一番むずかしい。少ない機能を実装しようとすると普通の人はサボっているとか生産性が低いなどと思ってしまうだろう)、などなど、様々なパラメータがあるが、これらが開発に影響にどのように影響するか。おそらく完全に理解してもらうのは不可能だろう。

        • -

そんなわけで、僕の周りのアジャイルだとかAIとかのバズワードの信頼度は下がるばかりだ。実際にはそれら自体ではなく、その言葉を誤用している僕らやステークホルダーが悪いのだけども。こういったことで時代の潮流に遅れないようにしたいと願うばかりだ。

ソフトウェアとビジネスの狭間

Hackernewsみてたらこんな記事が。

news.distrokid.com

ソフトウェア書きとしては気持ちのいい話だ。特にこのご時世、JASRACの話とも相まって、相乗効果的にその印象が強まってくる。

    • -

まあ、音楽面の話はさておき、ソフトウェアを書くことの価値とはなんだろうかと思うことがある。実際会社でソフトウェアは書いているけれども、それを責任もって事業化し、売上げてくれるのは別の部署の人たちだ。我々開発者がそのソフトウェアについての価値について直接考える機会はほとんど失われてしまっている。逆に我々に求められているのは品質やコスト、納期であり、いかにバグのないソフトを安く早く作るかということに主眼をおいている。それはそれで開発に集中できるのでいいのだけれど、ときには俯瞰して考えたい。

そもそもソフトウェアの価値とはなんだろうか。

古来、というより、欧米でよく言われる「ドットコムバブル」の時代、あるいはさらにその前時代、ソフトウェアの価値は複製の容易性にあった。一度ソフトウェアを書いてしまえば、ほとんどコストの無視できるメディア代だけで価値を増幅することができたのだ。それまで存在いたあらゆる製品は、生産に大規模な設備を要し、流通経路を確保し、顧客に届けなければならなかった。これがソフトウェアではほとんど無視することができたのだ。

さらに現代、更にその仕組は強化され、ほとんど物理的な物流に依存することなく、ソフトウェアの価値を顧客に提供することが出来るようになった。顧客にはプラットフォームとなるハードウェアすら準備する必要がなくなったのだ。そのため、顧客はほとんど設備投資する必要なく、ソフトウェアを手に入れることができるようになった。

しかし、おそらくソフトウェアを開発する総コストは根本的に変わってないというところに注目しなければならない。

あらゆる技術の革新でより早く高機能なものを顧客に提供できるようにはなってきている。しかしそこに投入するエンジニアのリソースは変わっていないように思える。顧客の要望も技術的革新に追従し、ハイレベルなものになってきているためだ。結果として、ソフトウェアをビジネス化するには、より少ない生産量で、より多くの顧客をかかえることが重要度を増すようになってきたのだ。

ここで僕は自分を振り返りたい。自分は開発としてこのソフトウェアの優位性を理解し、仕事をしているだろうか。誰か特定の顧客のためだけに愚直に価値を提供してやいないだろうか。

  • -

上記記事では、ほとんどの定形業務を自動化することにより極端に少ない人数での業務のオペレーションに成功している。言葉でいえば単純だが、自動化はソフトウェアの得意とする一分野であり、さらにそれをうまくスケールするところまで成功している。また、他のサービスと異なるのは、これが既存産業をおびやかしにかかっているところだ。強力な既得権を置き換えにかかるその様は、きっと開発者本人も予想しなかったことだろう。

EmacsでSMTPの設定を変更をする

メールアカウントのパスワードを変更したんだけど、EmacsSMTPの設定の方法がわからずうなってた。IMAP側はmu4e使ってるから、すぐわかったんだけどね。。SMTPはinit.elみてもパスワードの設定なんて書いてなかった。

EmacsWiki: Sending Mail

ここには、設定するときにプロンプトが出ますよ、ってなことが書いてあったが、一度設定してしまうともう出てこないので、うーん、と悩んでいた。ちゃんと読むと、

$(HOME)/.authinfo or $(HOME)/.authinfo.gpg

に設定ファイルが書き込まれている、とのことだったので、ここを参照して変更したら、解決。

    • -

最近Emacsの話ばっかり書いてるな。ちょっとでも仕事の話が絡むと記事にできないんだけど、Emacsはその点直接は関係ないから、書きやすいのだ。

バグ

Hacker Newsみてたらこんな記事が。

The Mark I Computer at Harvard

昔、「バグっていうのは、機械が動かなくなったときに原因を調べたら、虫がはさまってたっていう話が起源なんだよ」ってのを聞いた気がしていて、それをなんとなく信じていた。でも、この記事読む限り、それ以前から電気機械の故障を「バグ」って呼んでたみたい。

そうすると、逆にその「バグ」は一体何由来のものか気になるが..

こういう黎明期のコンピュータは何かそそられるものがあるねえ。当時の最先端の技術が垣間見れるからなんだけど、実際にリレー式のコンピュータがガチャガチャと音を立てて動く様は感動するものがある。動作としては一個一個のからくりはわかるんだけど、それで計算結果が出力される不思議といったら。

今のCPUは完全にブラックボックス化されているから、それを感じることすらなかなかないんだな。

Windows8にVMWare PlayerつっこんでCentOS 7.2 を入れた話

掲題のとおりなんだけど、うまくいかなくて、無理やり解決させたので、メモ

前座

VMWare Workstation Playerなるものがあって、これをWindows8につっこんで、Cent OS 7.2を入れようとした。んで、割りと途中まではうまくいっていて、Windows側からVMディレクトリ共有して、マウントしようと思ったら、ハマった。なぜか解決策がなかなか出なかった、

エラー詳細

ディレクトリを共有させるんだけど、要はvmware-install.plを動作させる。以下がまとまっていて、わかりやすい。

VM上のCentOSとホストOS(Windows7)とでファイル共有したメモ - MofuMofuFarm

色々むにゃむにゃ動くんだけど、ここで以下エラー。

/tmp/modconfig-CXZXGV/vmhgfs-only/page.c:1649:23: エラー: 関数 ‘wait_on_bit’ への引数が多すぎます
                       TASK_UNINTERRUPTIBLE);
                       ^
In file included from include/linux/mmzone.h:9:0,
                 from include/linux/gfp.h:5,
                 from include/linux/mm.h:9,
                 from include/linux/pagemap.h:7,
                 from /tmp/modconfig-CXZXGV/vmhgfs-only/page.c:28:
include/linux/wait.h:1044:1: 備考: ここで宣言されています
 wait_on_bit(void *word, int bit, unsigned mode)
 ^
make[2]: *** [/tmp/modconfig-CXZXGV/vmhgfs-only/page.o] エラー 1

なんかライブラリの生成に失敗しているようだ。

同様のエラーは以下記事でも報告されている。
CentOS 7.3 & VMware Tools でファイル共有機能の不具合 « minor tranquilizer

解決

で、自分は上記記事でなくて、こちらを参考にした。

CentOS 7 安装 vmware-tools-懂客-dongcoder.com

中国語なので、超訳(原文は何言っているかわからないが、試行錯誤した結果)。

ソースを取得する。

以下を解凍する。

vmware-tools-distrib/lib/modules/source/vmhgfs.tar

すると、vmhgfs-onlyを入手できる。

ソース修正

vmhgfs-only/page.cの1639行付近を以下のように修正

-    #if LINUX_VERSION_CODE >= KERNEL_VERSION(3, 19, 0)
+   #if LINUX_VERSION_CODE >= KERNEL_VERSION(3, 10, 0)

保存しておく。

もとの場所にもどす。

vmhgfs-onlyをvmhgfs.tarに固め(ファイル名に注意)、lib/modules/source/vmhgfs.tarに上書きする。

スクリプト再実行

vmware-install.plを再実行。

あとがき

普段Windowsに寄生するタイプの仮想環境なんて使わないから、ビビりながら使ってたが、こんなところでハマるとは。。あんまり日本語の情報でてこないってことはVMware自体のユーザが少ないってことなのかなあ。みんなVirtualBoxにうつったのか、もしくはクラウドなんかをホームコンピューティングの目的で借りちゃったりしてるのかもしれないな。