|
<img src="https://github.com/Unity-Technologies/ml-agents/blob/main/docs/images/image-banner.png" align="middle" width="3000"/> |
|
|
|
# Unity ML-Agents Toolkit Version Release 7 |
|
|
|
[](https://github.com/Unity-Technologies/ml-agents/tree/release_7_docs/docs/) |
|
[](LICENSE) |
|
|
|
([latest release](https://github.com/Unity-Technologies/ml-agents/releases/tag/latest_release)) |
|
([all releases](https://github.com/Unity-Technologies/ml-agents/releases)) |
|
|
|
**The Unity Machine Learning Agents Toolkit (ML-Agents)** - open-source проект, |
|
предназначенный для обучения искусственного интеллекта (агента) через взаимодействие со средой, - |
|
игрой или симуляцией, - используя различные методы машинного обучения: |
|
обучение с подкреплением (reinforcement learning), имитационное обучение (imitation learning), |
|
нейроэволюция (neuroevolution) и др. средствами Python API. В проекте реализованы также и современные |
|
алгоритмы (на основе TensorFlow), чтобы дать возможность как разработчикам игр так и любым другим, |
|
кто увлечен темой AI, обучать искусственный интеллект для 2D, 3D и VR/AR игр. Применение таких агентов |
|
бесчисленно: например, вы можете использовать их для управления NPC (опций также много - будь то |
|
обучение действиям в кооперативе или друг против друга), для тестирования различных версий сборок |
|
игры, а также для оценки гейм дизайнерских решений. ML-Agents объединяет разработчиков игр и |
|
исследователей AI, так как предоставляет единую платформу, в рамках которой новые разработки |
|
в сфере искусственного интеллекта могут быть протестированы через движок Unity и, как следствие, |
|
стать доступнее большему количеству и тех, и других. |
|
|
|
## Особенности: |
|
|
|
- Более [15 примеров на Unity](docs/Learning-Environment-Examples.md). |
|
- Большие возможности по конфигурации среды и тренировочных сценариев. |
|
- Unity SDK, который легко встроить в код вашей игры или в кастомную сцену в Unity |
|
- Два алгоритма глубинного обучения с подкреплением (deep reinforcement learning): |
|
Proximal Policy Optimization (PPO) и Soft Actor-Critic (SAC). Первый алгоритм старается узнать, |
|
какой будет наилучший шаг в конкретной ситуации, тогда как второй - узнать в целом правила |
|
игры/системы/симуляции, их закон и действовать согласно этому усвоенному закону изменения среды. |
|
- Встроенная поддержка для имитационного обучения (Imitation Learning), которое можно сделать |
|
либо через клонирование поведения (Behavioral Cloning), либо через генеративно-состязательное |
|
имитационное обучение (Generative Adversarial Imitation Learning - GAIL), когда одна часть алгоритма |
|
генерирует поведение, а другая определяет, похоже данное поведение на то, которое было дано как исходное, |
|
например, самим пользователем в виде записи его действий. Генерация происходит до тех пор, пока |
|
сгенерированное поведение не будет определено как неотличимое или очень близкое к исходному. |
|
- Возможность для агента игры с самим собой, если агент обучается в контексте сценария “состязание”: |
|
например, игра в футбол, где есть две команды. |
|
- ML-Agents позволяет настроить череду сцен, где каждая новая сцена - это усложнение сцены предыдущей, |
|
например, добавление новой преграды. Не всегда поставленную задачу агент сможет научиться |
|
выполнять, если среда слишком сложная изначально. Дайте ему сначала сценку попроще, когда |
|
он научиться ее проходить, его перенесет на уровень посложнее. |
|
- Обучение агента, устойчивого к изменениям, с помощью возможности случайного генерации элементов сцены |
|
- Гибкий контроль агента: демонстрация выученного поведения только при определенных условиях. |
|
Например, NPC входит в контекст “атака” - атакует так, как научился ранее в рамках обучающего сценария. |
|
- Обучение агента сразу на множестве сцен одновременно. Представьте, как он играет в футбол сразу |
|
на десяти стадионах, набираясь опыта одновременно на них всех. Выглядит это в Unity также, |
|
как и представляется. |
|
- Использование [Unity Inference Engine](docs/Unity-Inference-Engine.md) для поддержки кроссплатформенности. |
|
- Контроль через [Python API](docs/Python-API.md) сцен. |
|
- Возможность обернуть Unity среду для обучения как [gym](gym-unity/README.md). |
|
|
|
Для более детального ознакомления с данными особенностями см. [Обзор ML-Agents] (docs/ML-Agents-Overview.md). |
|
|
|
## Релизы и Документация |
|
|
|
**Наш последний стабильный релиз - это `7-ой Релиз` (Release 7). |
|
См. [здесь](https://github.com/Unity-Technologies/ml-agents/tree/release_7_docs/docs/Readme.md), |
|
чтобы начать работать с самой последней версий ML-Agents.** |
|
|
|
Таблица внизу - список всех наших релизов, включая main ветку, над которой мы ведем активную работу |
|
и которая может быть нестабильной. Полезная информация: |
|
|
|
[Управление версиями](docs/Versioning.md) - описание того, как мы работам с GitHub. |
|
[Релизы](https://github.com/Unity-Technologies/ml-agents/releases) - об изменениях между версиями |
|
[Миграция](docs/Migrating.md) - как перейти с более ранней версии ML-Agents на новую. |
|
Ссылки на **документацию** - как установить и начать пользоваться ML-Agents в зависимости от версии. |
|
Всегда используйте только ту документацию, которая относится к той версии, которую вы установили: |
|
|
|
| **Version** | **Дата релиза** | **Source** | **Документация** | **Загрузка** | |
|
|:-------:|:------:|:-------------:|:-------:|:------------:| |
|
| **main (unstable)** | -- | [source](https://github.com/Unity-Technologies/ml-agents/tree/main) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/main/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/main.zip) | |
|
| **Release 7** | **16 Сентября, 2020** | **[source](https://github.com/Unity-Technologies/ml-agents/tree/release_7)** | **[docs](https://github.com/Unity-Technologies/ml-agents/tree/release_7_docs/docs/Readme.md)** | **[download](https://github.com/Unity-Technologies/ml-agents/archive/release_7.zip)** | |
|
| **Release 6** | 12 Августа, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_6) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_6_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_6.zip) | |
|
| **Release 5** | 31 Июля, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_5) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_5_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_5.zip) | |
|
| **Release 4** | 15 Июля, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_4) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_4_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_4.zip) | |
|
| **Release 3** | 10 Июня, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_3) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_3_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_3.zip) | |
|
| **Release 2** | 20 Мая, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_2) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_2_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_2.zip) | |
|
| **Release 1** | 30 Апреля, 2020 | [source](https://github.com/Unity-Technologies/ml-agents/tree/release_1) | [docs](https://github.com/Unity-Technologies/ml-agents/tree/release_1_docs/docs/Readme.md) | [download](https://github.com/Unity-Technologies/ml-agents/archive/release_1.zip) | |
|
|
|
## Цитирование |
|
|
|
Если вас интересует Unity как платформа для изучения AI, см. [нашу работу Unity и ML-Agents](https://arxiv.org/abs/1809.02627). |
|
Если вы используете Unity или ML-Agents для исследовательской работы, пожалуйста, указывайте |
|
в списке используемой литературы следующую работу: |
|
Juliani, A., Berges, V., Teng, E., Cohen, A., Harper, J., Elion, C., Goy, |
|
C., Gao, Y., Henry, H., Mattar, M., Lange, D. (2020). Unity: A General Platform for |
|
Intelligent Agents. _arXiv preprint |
|
[arXiv:1809.02627].(https://arxiv.org/abs/1809.02627)._ |
|
https://github.com/Unity-Technologies/ml-agents. |
|
|
|
## Дополнительные источники: |
|
|
|
Мы опубликовали серию статей на нашем блоге про ML-Agents (**пока без перевода на русский**): |
|
|
|
- (12 Мая, 2020) |
|
[Announcing ML-Agents Unity Package v1.0!](https://blogs.unity3d.com/2020/05/12/announcing-ml-agents-unity-package-v1-0/) |
|
- (28 Февраля, 2020) |
|
[Training intelligent adversaries using self-play with ML-Agents](https://blogs.unity3d.com/2020/02/28/training-intelligent-adversaries-using-self-play-with-ml-agents/) |
|
- (11 Ноября, 2019) |
|
[Training your agents 7 times faster with ML-Agents](https://blogs.unity3d.com/2019/11/11/training-your-agents-7-times-faster-with-ml-agents/) |
|
- (21 Октября, 2019) |
|
[The AI@Unity interns help shape the world](https://blogs.unity3d.com/2019/10/21/the-aiunity-interns-help-shape-the-world/) |
|
- (15 Апреля, 2019) |
|
[Unity ML-Agents Toolkit v0.8: Faster training on real games](https://blogs.unity3d.com/2019/04/15/unity-ml-agents-toolkit-v0-8-faster-training-on-real-games/) |
|
- (1 Марта, 2019) |
|
[Unity ML-Agents Toolkit v0.7: A leap towards cross-platform inference](https://blogs.unity3d.com/2019/03/01/unity-ml-agents-toolkit-v0-7-a-leap-towards-cross-platform-inference/) |
|
- (17 Декабря, 2018) |
|
[ML-Agents Toolkit v0.6: Improved usability of Brains and Imitation Learning](https://blogs.unity3d.com/2018/12/17/ml-agents-toolkit-v0-6-improved-usability-of-brains-and-imitation-learning/) |
|
- (2 Октября, 2018) |
|
[Puppo, The Corgi: Cuteness Overload with the Unity ML-Agents Toolkit](https://blogs.unity3d.com/2018/10/02/puppo-the-corgi-cuteness-overload-with-the-unity-ml-agents-toolkit/) |
|
- (11 Сентября, 2018) |
|
[ML-Agents Toolkit v0.5, new resources for AI researchers available now](https://blogs.unity3d.com/2018/09/11/ml-agents-toolkit-v0-5-new-resources-for-ai-researchers-available-now/) |
|
- (26 Июня, 2018) |
|
[Solving sparse-reward tasks with Curiosity](https://blogs.unity3d.com/2018/06/26/solving-sparse-reward-tasks-with-curiosity/) |
|
- (19 Июня, 2018) |
|
[Unity ML-Agents Toolkit v0.4 and Udacity Deep Reinforcement Learning Nanodegree](https://blogs.unity3d.com/2018/06/19/unity-ml-agents-toolkit-v0-4-and-udacity-deep-reinforcement-learning-nanodegree/) |
|
- (24 Мая, 2018) |
|
[Imitation Learning in Unity: The Workflow](https://blogs.unity3d.com/2018/05/24/imitation-learning-in-unity-the-workflow/) |
|
- (15 Марта, 2018) |
|
[ML-Agents Toolkit v0.3 Beta released: Imitation Learning, feedback-driven features, and more](https://blogs.unity3d.com/2018/03/15/ml-agents-v0-3-beta-released-imitation-learning-feedback-driven-features-and-more/) |
|
- (11 Декабря, 2017) |
|
[Using Machine Learning Agents in a real game: a beginner’s guide](https://blogs.unity3d.com/2017/12/11/using-machine-learning-agents-in-a-real-game-a-beginners-guide/) |
|
- (8 Декабря, 2017) |
|
[Introducing ML-Agents Toolkit v0.2: Curriculum Learning, new environments, and more](https://blogs.unity3d.com/2017/12/08/introducing-ml-agents-v0-2-curriculum-learning-new-environments-and-more/) |
|
- (19 Сентября, 2017) |
|
[Introducing: Unity Machine Learning Agents Toolkit](https://blogs.unity3d.com/2017/09/19/introducing-unity-machine-learning-agents/) |
|
- Обзор обучения с подкреплением ( |
|
[multi-armed bandit](https://blogs.unity3d.com/2017/06/26/unity-ai-themed-blog-entries/) |
|
и |
|
[Q-learning](https://blogs.unity3d.com/2017/08/22/unity-ai-reinforcement-learning-with-q-learning/)) |
|
|
|
Дополнительные материалы от других авторов: |
|
- [A Game Developer Learns Machine Learning] (https://mikecann.co.uk/machine-learning/a-game-developer-learns-machine-learning-intent/) |
|
- [Explore Unity Technologies ML-Agents Exclusively on Intel Architecture](https://software.intel.com/en-us/articles/explore-unity-technologies-ml-agents-exclusively-on-intel-architecture) |
|
- [ML-Agents Penguins tutorial](https://learn.unity.com/project/ml-agents-penguins) |
|
|
|
## Community and Feedback |
|
|
|
ML-Agents Toolkit - open-source проект, поэтому мы рады любой помощи. Если вы хотите нам помочь, |
|
ознакомьтесь, для начала, пожалуйста, для с [гайдом, как сделать это правильно](com.unity.ml-agents/CONTRIBUTING.md), |
|
и [кодексом поведения](CODE_OF_CONDUCT.md). |
|
|
|
Если возникли проблемы с установкой и настройкой ML-Agents, если вы хотите обсудить как лучше всего |
|
обучать агентов и пр., пожалуйста, посмотрите возможные решения на [форуме Unity ML-Agents](https://forum.unity.com/forums/ml-agents.453/). |
|
Если вы не найдете нужной вам информации, начните новую тему, дав подробное описания вашей проблемы. Если вы обнаружили |
|
какие-то баги или ошибки во время работы с ML-Agents, пожалуйста, сообщите об этом [здесь](https://github.com/Unity-Technologies/ml-agents/issues). |
|
|
|
Нам важно знать ваше мнение. Только на его основе проект Unity ML-Agents и продолжает развиваться. |
|
Пожалуйста, уделите несколько минут и [поделитесь](https://github.com/Unity-Technologies/ml-agents/issues/1454) |
|
с нами тем, что могло бы улучшить наш проект. |
|
|
|
По всем остальным вопросам или отзыву, пишите сразу на адрес команды разработчиков ML-Agents - [email protected]. |
|
|
|
## Лицензия |
|
|
|
Apache License 2.0 |
|
|