7 мая 2026 г.·2 мин чтения

Model card на собеседовании Data Scientist

Проверь себя · 1/3разбор после ответа

Если n увеличили в 4 раза при том же p, как примерно изменится стандартная ошибка доли SE = sqrt(p*(1-p)/n)?

Содержание:

Что такое model card
Структура
Intended use
Performance metrics
Ethical considerations
Связанные темы
FAQ

Что такое model card

Documentation для ML model. Like dataset readme, но для model.

Mitchell 2019 (Google). Standard в Hugging Face Hub.

Структура

Template:

# Model Card: model_name

## Model Details
- Architecture, version, authors.

## Intended Use
- Primary uses.
- Out-of-scope uses.

## Training Data
- Source, size, composition.

## Evaluation
- Metrics, benchmarks.
- Per-subgroup performance.

## Ethical Considerations
- Biases.
- Risks.
- Mitigations.

## Caveats
- Limitations.
- Recommendations.

Intended use

Critical — declare what model для.

Primary uses. «Email spam classifier для В2С email».

Out of scope. «Не использовать для legal advice classification».

Helps users assess fit к their use case. Prevents misuse.

Готовься к собесу аналитика как в Duolingo

10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram

Открыть Карьерник в Telegram

Performance metrics

Не just average. Disaggregated:

Per language.
Per demographic group.
Per data source.

| Group | Accuracy |
| RU users | 92% |
| Other | 87% |

Reveals biases, areas needing improvement.

Ethical considerations

Bias sources. Training data demographics, label biases.

Privacy. PII в training? PII в outputs (training data leakage)?

Misuse potential. Could used для discrimination, manipulation?

Mitigations. Что мы сделали — fair sampling, bias testing, content filters.

В regulated industries (finance, medicine) — model card is mandatory artifact.

Связанные темы

FAQ

Это официальная информация?

Нет. Статья основана на работе Mitchell 2019 «Model Cards for Model Reporting».

Тренируйте Data Science — откройте тренажёр с 1500+ вопросами для собесов.