1. ShellからSPSS Modeler Batchを起動
SPSSサーバ上にストリームファイルを配置
SPSSサーバーが二重化していた場合は、その起動方法を確認
2. ShellからPython APIでC&DS経由でのSPSSジョブ起動
SPSSストリーム定義は、ファイルシステムではなく、リポジトリ定義
C&DS上でのジョブ定義
監査ログはC&DSが出力。No1の場合は、shellで自ら出力
DB認証はC&DS定義。負荷分散はC&DSが自ら実施。
2013年10月17日木曜日
2013年6月24日月曜日
思い込みによるデータストアの違い
大分見えてきた仕様について、データーフローダイアグラムで仕様を落とすようにという指示の元、処理機能記述書を記述してみた。それをチーム内レビューしてみたら、どうにも話が合わない。相手は、データストアに対する処理とデータフローに入れる為の処理は異なるというのだ。こちらは、データストアはテーブルのイメージで、そこからSQLでデータを抽出すればよいのだから、処理機能記述書には、そのSQLの内容を書けばよいと思っていた。
しかし、彼はその発想ではなく、データストアは、Javaのエンティティ・オブジェクトのイメージだから、データストアの処理とデータフローの処理は、確実に分離しているのだ。
おっと、自分がどれだけ先入観に、とらわれているんだと思った。長年のやり方に、はまってしまっていることを反省したが、日々の中では気付かないことも多々あるのだろう。
ちょっとした考察。
しかし、彼はその発想ではなく、データストアは、Javaのエンティティ・オブジェクトのイメージだから、データストアの処理とデータフローの処理は、確実に分離しているのだ。
おっと、自分がどれだけ先入観に、とらわれているんだと思った。長年のやり方に、はまってしまっていることを反省したが、日々の中では気付かないことも多々あるのだろう。
ちょっとした考察。
2013年4月16日火曜日
トヨタ カイゼンの為の訓示(鬼十訓)
リーンも参考にした トヨタ生産方式を開発した大野耐一さんの訓示のメモ。
マインドの持ち方の話ということで自己啓発的な側面もあるが、カイゼンというものに対する態度という意味で、真摯に取り組んでみることが大切ということを感じた。
特に下記の5点については、今から私自身が変えるべきポイントという意味で強い刺激を受けた。
・モノをつくるのではなく、「必要なモノをつくる」。
・まずやらせるな。まずやってみせろ。
汗をかかせるな。知恵に欠けてくる。
・多忙を改めたいなら、仕組みを改めることだ。
・やさしいことはくり返し言え。
・「できる」信念も、「できない」信念も強さは同じだ。
第1訓
君はコストだ。まずムダを削れ。それなくして能力は展開できない。
ムダは隠れる。仕事の隠しごとをまずやめよ。
小さな数字を集めろ。大きなムダが見えてくる。
過去の数字で計画を立てるな。過去のムダを引き継ぐことになる。
生産性で自分をはかれ。忙しさは生産性ではない。
モノをつくるのではなく、「必要なモノをつくる」。
第2訓
始めたらねばれ。できるまでやめるな。中途半端はクセになる。
わかったつもりになるな。「まだ」に発見がある。
応急処置を避けよ。「その場でとことん」をクセにしろ。
「できるかぎりやる」でなく、「できるまでやる」んだ。
満足しても慢心するな。自信があっても過信をするな。
第3訓
困れ。困らせろ。安易を好む人と決定的な能力格差がつく。
大増産を小増員でやれ。成長の秘密はそこにしかない。
仕事は「可能か」で決めるな。つねに「必要か」で決めよ。
答えを教えるな。考えさせる工夫をしろ。
ほしいときは「なくても」で、上げたければ「下げたら」で発想せよ。
人を動かすには気持ちを揺さぶる。揺さぶるには困難を持ち込む。
第4訓
ライバルは君より優秀だ。すなわち君は「今」始めることでのみ勝てる。
様子を見すぎるな。タイミングに見放される。
なんでもその場でやれ。なんでもすぐ片づく。
明日でも対策は見込めるが、今日なら良策が仕込める。
積み上げが、仕事を鍛え上げる。
第5訓
仕事に痕跡を刻め。十割を命じられても十一割めを自前の知恵でやれ。
「できた」で止まるな。「もっとできる」に進め。
言葉通りにやらず、言葉に知恵を足せ。
一律を避けよ。労働強化のもとになる。
教えるな。気づかせろ。
第6訓
平伏させず心服させろ。そのためにはだれより長い目で人を見ることだ。
適材適所に「適時」を加えよ。
手をかけ時間をかける。そうしてこそ人から声がかかり始める。
まずやらせるな。まずやってみせろ。
汗をかかせるな。知恵に欠けてくる。
第7訓
「できる」とまず言え。そこに方法が見つかる。
「できる」を信じる。「できない」は疑う。
知恵は平等だ。知恵の引き出し方で差がつく。
評論家を評価するな。批判で判断を終えるな。
多忙を改めたいなら、仕組みを改めることだ。
第8訓
失敗を力にしろ。真の自信も運もリカバリーから生まれる。
成果を上げるには、ネを上げないことだ。
「失敗だ」とあきらめるな。「失敗にしたくない」と発想せよ。
支持されたいなら、指示を減らすんだ。
数字の嘘を見抜け。教師は現場である。
第9訓
労働強化を避けよ。人間「ラクになるには」に一番頭が働く。
「平均的に」はラクではない。「最速で」がラクである。
失敗パターンを改善せよ。成功パターンも改善せよ。
目標値が高ければ、出発点は低くていい。
利潤で決めていいが、利潤だけで決めてはならない。
第10訓
お客の叱声は成功の呼び声だ。逃すな。いじけるな。考え抜け。
相手を変えたいなら、自分が変わるんだ。
むずかしいことはやさしく言え。やさしいことはくり返し言え。
「できる」信念も、「できない」信念も強さは同じだ。
いいチームにせよ。いいチームができたら改善せよ。
マインドの持ち方の話ということで自己啓発的な側面もあるが、カイゼンというものに対する態度という意味で、真摯に取り組んでみることが大切ということを感じた。
特に下記の5点については、今から私自身が変えるべきポイントという意味で強い刺激を受けた。
・モノをつくるのではなく、「必要なモノをつくる」。
・まずやらせるな。まずやってみせろ。
汗をかかせるな。知恵に欠けてくる。
・多忙を改めたいなら、仕組みを改めることだ。
・やさしいことはくり返し言え。
・「できる」信念も、「できない」信念も強さは同じだ。
第1訓
君はコストだ。まずムダを削れ。それなくして能力は展開できない。
ムダは隠れる。仕事の隠しごとをまずやめよ。
小さな数字を集めろ。大きなムダが見えてくる。
過去の数字で計画を立てるな。過去のムダを引き継ぐことになる。
生産性で自分をはかれ。忙しさは生産性ではない。
モノをつくるのではなく、「必要なモノをつくる」。
第2訓
始めたらねばれ。できるまでやめるな。中途半端はクセになる。
わかったつもりになるな。「まだ」に発見がある。
応急処置を避けよ。「その場でとことん」をクセにしろ。
「できるかぎりやる」でなく、「できるまでやる」んだ。
満足しても慢心するな。自信があっても過信をするな。
第3訓
困れ。困らせろ。安易を好む人と決定的な能力格差がつく。
大増産を小増員でやれ。成長の秘密はそこにしかない。
仕事は「可能か」で決めるな。つねに「必要か」で決めよ。
答えを教えるな。考えさせる工夫をしろ。
ほしいときは「なくても」で、上げたければ「下げたら」で発想せよ。
人を動かすには気持ちを揺さぶる。揺さぶるには困難を持ち込む。
第4訓
ライバルは君より優秀だ。すなわち君は「今」始めることでのみ勝てる。
様子を見すぎるな。タイミングに見放される。
なんでもその場でやれ。なんでもすぐ片づく。
明日でも対策は見込めるが、今日なら良策が仕込める。
積み上げが、仕事を鍛え上げる。
第5訓
仕事に痕跡を刻め。十割を命じられても十一割めを自前の知恵でやれ。
「できた」で止まるな。「もっとできる」に進め。
言葉通りにやらず、言葉に知恵を足せ。
一律を避けよ。労働強化のもとになる。
教えるな。気づかせろ。
第6訓
平伏させず心服させろ。そのためにはだれより長い目で人を見ることだ。
適材適所に「適時」を加えよ。
手をかけ時間をかける。そうしてこそ人から声がかかり始める。
まずやらせるな。まずやってみせろ。
汗をかかせるな。知恵に欠けてくる。
第7訓
「できる」とまず言え。そこに方法が見つかる。
「できる」を信じる。「できない」は疑う。
知恵は平等だ。知恵の引き出し方で差がつく。
評論家を評価するな。批判で判断を終えるな。
多忙を改めたいなら、仕組みを改めることだ。
第8訓
失敗を力にしろ。真の自信も運もリカバリーから生まれる。
成果を上げるには、ネを上げないことだ。
「失敗だ」とあきらめるな。「失敗にしたくない」と発想せよ。
支持されたいなら、指示を減らすんだ。
数字の嘘を見抜け。教師は現場である。
第9訓
労働強化を避けよ。人間「ラクになるには」に一番頭が働く。
「平均的に」はラクではない。「最速で」がラクである。
失敗パターンを改善せよ。成功パターンも改善せよ。
目標値が高ければ、出発点は低くていい。
利潤で決めていいが、利潤だけで決めてはならない。
第10訓
お客の叱声は成功の呼び声だ。逃すな。いじけるな。考え抜け。
相手を変えたいなら、自分が変わるんだ。
むずかしいことはやさしく言え。やさしいことはくり返し言え。
「できる」信念も、「できない」信念も強さは同じだ。
いいチームにせよ。いいチームができたら改善せよ。
2013年1月11日金曜日
データ・サイエンティスト
昨年ころから、ビッグデータと結びつけられてデータ・サイエンティストという言葉が、そこそこ出てきたという気がする。データ科学、科学的思考、統計学、可視化技術、先端コンピューティングという複雑なData scientistの領域で、複雑なデータの問題の解決に従事する人を呼ぶそうだ。
ビッグデータとデータ・サイエンティストは、元々は別物の話であるが、昨年からのビッグデータの高まりから、同様に理解されていることが多い。
データ統計解析環境として、「R」と呼ばれるオープンソースがあるらしい。今年は少し試してみようかと思う。
http://cran.md.tsukuba.ac.jp/
ビッグデータとデータ・サイエンティストは、元々は別物の話であるが、昨年からのビッグデータの高まりから、同様に理解されていることが多い。
データ統計解析環境として、「R」と呼ばれるオープンソースがあるらしい。今年は少し試してみようかと思う。
http://cran.md.tsukuba.ac.jp/
登録:
投稿 (Atom)