#
Git
Press
ひよっこアナライズ
Login
Author
ひよっこアナライズ
データ分析を生業としてひっそりと生きています。/ 要因分析、効果検証、数値予測、異常検知、テキスト分析なんでもやります。/ 主にPython、SQLユーザー。ごくまれにSPSS Modeler、R。/ このページは、「自分の備忘録としては残しておきたいが、N番煎じなのでQiitaには載せない」ことを書く。/ なので出力結果や詳細な説明は書いていない。/ Qiita: https://qiita.com/chicken_data_analyst
Collection
ひよっこアナライズ
has 0
collections
Posts
2023/11/30
BigQueryで変数定義 & 関数定義
CREATE TEMP FUNCTION StartTime1() RETURNS timestamp AS ('2023-01-01 00:00:00');CREATE TEMP FUNCTION StartDate1() RETURNS DATE AS (DATE(StartTime1()));CREATE TEMP FUNCTION StartSuffix1() RETURNS STRING AS (format_date('%Y%m%d',StartDate1()));
2023/11/22
いろいろ可視化の備忘録
普通にヒストグラムを書いた時に、外れ値のせいで横軸のレンジが広くなりすぎて、左隅に1本棒が立っているだけの意味のない可視化になる時が多い。それを避けるために、クリッピングで数値丸めてからヒストグラム書くと、意味のある可視化になりやすい。fig=plt.figure(figsize=(18,14))
2023/11/22
自然言語処理前処理Tips
前処理してMecabやGiNZAで分かち書きするまでimport osimport numpy as np
2023/09/12
DockerでMecab備忘録
公式
2023/09/12
dockerの備忘録
dockerの基本的な使い方参考のまとめ。docker desktopは有償化したのでdocker engineを使用した方がいい。docker engineはWindowsの場合、WSL上で使う。
2023/09/11
週単位のガントチャート作成コード
ざっくりスケジュール作成のための、週単位のガントチャートを作る。参考:https://plotly.com/python/gantt/
2023/08/14
vimでクリップボードを有効にする
apt search vimapt install vim-gtk3[Vimでクリップボードからのペーストを可能にする](
2023/03/30
mlflowの備忘録
experiment_nameをもとにexperiment_idを取得して、取得したexperiment_idのrun_ind番目のrun_idを取得して、取得したrun_idに保存しているpickleファイルをロードする。import mlflowfrom mlflow.sklearn import log_model
2022/10/20
OptunaのLightGBMTunerCV備忘録
意外にLGBMのOptuna最適化をしたことがないことに気づいたのでコードを書いた。不均衡データに対して実施したので、損失関数に重みづけしているようなかコードになっている。def sample_w(y_train, multip=1):
2022/07/07
サンキーダイヤグラム作成備忘録
昔作ったことあるけど、昔よりもっと簡単に作れるようにplotlyが進化していた。参考:https://oeconomicus.jp/2021/07/plotly-color-scale/
2022/07/07
Rでデータハンドリング & ベイジアンネットワーク備忘録
参考:https://qiita.com/hrkz_szk/items/a213c2c4ba823cbf78f6
2022/07/07
kerasのfunction APIで多入力多出力モデル作る備忘録
例えば、説明変数40個×3、目的変数3個でモデルを作るとする。入力層を複数用意して、tensorflow.keras.layers.concatenateで結合する。そのままネットワークを組んで、出力層も目的変数の数の文だけ作る。
2022/07/06
MecabでNeologd登録(Windows10)の備忘録
新しいPCで久々にMecabの環境作っているときに、Neologdの登録方法をけっこう忘れていたので備忘録。※インストールしているMecabはC:\Program Files\MeCab\binのPath通しておくNeologd辞書をダウンロード。
2022/07/06
pytorch, transformersのインストール備忘録
" https://pytorch.org/ "で、自分の環境にあったインストール方法がわかる。また、日本語でtransformersを使う場合、fugashiやipadicが必要。なので、pytorch, transformersをインストールするときは以下を実行。
2022/06/24
poetryの備忘録
Anaconda有償化で社内使用NGの場合、conda仮想環境も使えない。 conda以外いろいろなアプローチがあるけど、pyenv+poetryという選択もある。
2022/06/24
2クラス分類評価備忘録
2クラス分類の評価アプローチ。混同行列で分類精度を見られる。Calibration Curveで分類の予測確率の精度を見られる。
2022/06/24
Shapについて調べたこと備忘録
Tree explainerでShap値を求めるとき、データに比例して時間がかかるのですべてのデータを渡さずサンプリングすることが推奨されていいる。(以下URLのfeature_perturbationの説明参照) https://shap-lrjball.readthedocs.io/en/docs_update/generated/shap.TreeExplainer.html
2022/06/24
Annoyを使った近似近傍探索モデルの備忘録
近似近傍探索モデル作成できるパッケージAnnoyの使い方。 インストールはAnacondaならconda installで一発。
« Newer
1 / 1
Older »