データ品質
Data quality。データの扱いやすさの指標。理想のデータセットは、値が正確で網羅性が満たされ、タイムリーに公開されて、項目の内容や例えば欠落しているデータ箇所を正しく表現する名称が付与されており、直接的に機械可読な状態で(データクリーニングを参照)、さらに入力値のカラムの命名規則が標準に沿っていて、ユーザが内容を把握しやすいよう十分なメタデータが付与されている。メタデータは例えば、データの公開元やデータセット内の値の意味などである。
- Improve this page Edit on Github Help and instructions
- Translate this page Translation guide
-
Donate
If you have found this useful and would like to support our work please consider making a small donation.