コマンドリファレンス

dm-attach-fileコマンド

dm-attach-file コマンドは、データセット(タグ/スキーマ)およびテーブルのコメントに添付するファイルを登録、一覧表示、削除します。

Usage: dm-attach-file [repo file] [target] [command]

Targets:
    tag:[tag label]
    schema:[schema name]
    table:[table name]

Commands:
    list
    add [file]
    rm [file]

Options:
    --help                     Print this help.

repo file はレポジトリファイル名です。

target は、tag, schema, table のいずれかのoターゲットを名前と共に指定します。

command は、list, add, rm のいずれかの操作をファイル名とともに指定します。

dm-dump-xlsコマンド

dm-dump-xls コマンドは、指定したExcelファイルのシートをCSV形式で出力します。

Excelのファイル名、およびシート名、またはシート番号(1,2,3…)を指定すると、シートの内容をCSV形式で標準出力に出力します。

Usage: dm-dump-xls <filename.xls> [<sheet name> | <sheet index>]

Options:
    -e STRING                  Output encoding (default: utf-8)

    --help                     Print this help.

-e オプションは出力するCSVデータのエンコーディングを指定します。

dm-export-repoコマンド

dm-export-repo コマンドは、レポジトリに保存されたメタデータ、統計情報、その他の補足的なデータを、をデータカタログとして指定したファイル形式(HTMLなど)でエクスポートします。

以下の形式でレポジトリのデータをエクスポートすることができます。

  • HTMLファイル
  • CSVファイル
  • JSONファイル
Usage: dm-export-repo [options...] [repo file] [output directory]

Options:
    --format <STRING>               Output format. (html, json or csv)
    --help                          Print this help.

Options for HTML format:
    --tags <TAG>[,<TAG>]            Tag names to be shown on the top page.
    --schemas <SCHEMA>[,<SCHEMA>]   Schema names to be shown on the top page.
    --template <STRING>             Directory name for template files.

Options for CSV format:
    --encoding <STRING>             Character encoding for output files.

repo file はレポジトリファイル名です。

output directory は出力先のディレクトリ名です。

--format は出力するフォーマットを指定します。デフォルトは html です。

--tags はデータカタログとして出力する際、トップページに優先的に表示するタグ名を指定します(指定していないものはタグ名順にソートして表示)。

--schemas はデータカタログとして出力する際、トップページに優先的に表示するスキーマ名を指定します(指定していないものはスキーマ名順にソートして表示)。

--templates はデータカタログとしてHTMLを生成する際に使用するテンプレートファイルのあるディレクトリです。

--encoding は出力するCSVファイルのエンコーディングを指定します。デフォルトは utf-8 です。

dm-import-csvコマンド

dm-import-csv コマンドは、テーブルやカラムに関する付加的な情報をCSVファイルからレポジトリにインポートします。

以下のCSVファイルをインポートすることができます。

  • テーブルメタデータCSV
  • カラムメタデータCSV
  • スキーマコメントCSV
  • タグコメントCSV
  • ビジネス用語辞書CSV
  • データ検証ルールCSV
Usage: dm-import-csv [repo file] [csv file]

Options:
    -E, --encoding=STRING      Encoding of the CSV file (default: sjis)
    --help                     Print this help.

repo file はレポジトリファイル名です。

-E, --encoding は入力となるCSVファイルのエンコーディングです。デフォルトは sjis です。

各CSVファイルのフォーマットについては「CSVファイルフォーマット」を参照してください。

dm-import-datamappingコマンド

dm-import-datamapping コマンドは、データマッピングの情報をCSVファイルからレポジトリにインポートします。

Usage: dm-import-datamapping [repo file] [csv file]

Options:
    -E, --encoding=STRING      Encoding of the CSV file (default: sjis)
    --help                     Print this help.

repo file はレポジトリファイル名です。

-E, --encoding は入力となるCSVファイルのエンコーディングです。デフォルトは sjis です。

CSVファイルのフォーマットについては「CSVファイルフォーマット」を参照してください。

dm-repo-cmdコマンド

dm-repo-cmd コマンドは、レポジトリに保存されているデータの操作を行います。

Usage: dm-repo-cmd [options...] [repo file | connetion string] [cmd] [args...]

Commands:
    init
    ls
    rm <db.schema.table>

Options:
    --help      Print this help.

init を指定すると、レポジトリを初期化します。

ls を指定すると、レポジトリに含まれるテーブル名の一覧を「データベース名.スキーマ名.テーブル名」の形式で取得します。

rm をテーブル名(データベース名.スキーマ名.テーブル名)とともに指定すると、レポジトリに含まれる当該テーブルのデータを削除します。

dm-run-profilerコマンド

dm-run-profiler コマンドは、データベースに接続してメタデータおよびデータプロファイルの取得を行い、その結果をレポジトリに保存します。また、あらかじめ定義したルールに従ってデータ検証を行います。

Usage: dm-run-profiler [option...] [schema[.table]] ...

Options:
    --dbtype=TYPE              Database type
    --host=STRING              Host name
    --port=INTEGER             Port number
    --dbname=STRING            Database name
    --tnsname=STRING           TNS name (Oracle only)
    --user=STRING              User name
    --pass=STRING              User password
    --credential=STRING        Credential file name (BigQuery only)
    -P=INTEGER                 Parallel degree of table scan
    -o=FILENAME                Output file
    --batch=FILENAME           Batch execution

    --enable-validation        Enable record/column/SQL validations

    --enable-sample-rows       Enable collecting sample rows. (default)
    --disable-sample-rows      Disable collecting sample rows.

    --skip-table-profiling     Skip table (and column) profiling
    --skip-column-profiling    Skip column profiling
    --column-profiling-threshold=INTEGER
                               Threshold number of rows to skip profiling
                               columns

    --timeout=NUMBER           Query timeout in seconds (default:no timeout)

    --help                     Print this help.

--dbtype はデータベース種別の指定です。 oracle, mssql, pgsql, mysql のいずれかを指定できます。Amazon Redshiftは pgsql を指定した上で、ポート番号も併せて指定する必要があります。

--host はデータベースに接続するホスト名です。

--port はデータベースに接続するポート番号です。

--dbname は接続するデータベースです。

--tnsname はTNS接続を使ってデータベースに接続する際のTNS名です(Oracleのみ)。

--user はデータベースに接続するユーザ名です。

--pass はデータベースに接続するパスワードです。

--credential はBigQueryに接続するためのcredentialファイル(JSON形式)です。

-P は内部でテーブルスキャンを実行する際の並列度です。

-o は出力するレポジトリのファイル名です。

--batch は一括して処理する複数のスキーマ名およびテーブル名を記述したファイルです。

--enable-validation はデータ検証の機能を有効にします。

--enable-sample-rows はサンプルレコード(10行)の取得を有効にします。(デフォルト)

--disable-sample-rows はサンプルレコードの取得を無効にします。

--skip-table-profiling はテーブルおよびカラムのプロファイリングを無効にします。

--skip-column-profiling はカラムのプロファイリングを無効にします。

--column-profiling-threshold はカラムのプロファイリングを行うレコード数の上限を指定します。

--timeout はクエリのタイムアウトを秒数で指定します。クエリの実行時間がこれを超えると中断され、テーブルのプロファイリングは失敗として扱われます。

dm-run-serverコマンド

dm-run-server コマンドは、指定したレポジトリのデータにネットワーク経由でアクセスするためのWebサーバを起動します。

dm-run-server コマンドを使うことによって、以下を実現することができます。

  • レポジトリのデータを都度HTMLにエクスポートしなくても閲覧可能
  • レポジトリのデータの変更をリアルタイムに閲覧可能
  • コメントやタグなど、一部のデータをWebブラウザから変更可能
Usage: dm-run-server [repo file] [port]

Options:
    --help                     Print this help.

repo file はレポジトリファイル名です。

port はWebサーバに接続するためのポート番号です。(デフォルト8080)

dm-verify-resultsコマンド

dm-verify-results コマンドは、レポジトリ内に保存されたデータ検証結果を参照して、違反しているレコードがないかどうかを確認します。

違反しているレコードがある場合は終了コード 1 を、ない場合には終了コード 0 を返します。

Usage: dm-verify-results [repo file]

Options:
    --help                     Print this help.

repo file はレポジトリファイル名です。