ИНСТРУМЕНТ HADOOP И ОПТИМИЗАЦИЯ ХРАНИЛИЩА ДАННЫХ
Ключевые слова:
хранилища данных, оптимизация, большие данные, технология, затраты.Аннотация
Хранилища данных превратились в крупнейшие базы данных организации. Хранилища данных растут в зависимости от количества пользователей, объема хранимых данных, количества источников данных и сложности отчетов и аналитических требований. С ростом хранилищ данных возникают проблемы с производительностью и параллелизмом, с затратами на хранение и обработку данных, которые могут стать неприемлемыми. В таких случаях организациям необходимо оптимизировать свои хранилища данных, а выбор методов и технологий оптимизации является актуальной проблемой.
Предложены подходы применения оптимальной технологии хранения данных Hadoop, которую используют в хранилищах данных для снижения затрат на хранение и обработку, а также для повышения эффективности отчетности и анализа.
Библиографические ссылки
1. https://www.tadviser.ru/index.php/Статья:Большие_данные_(Big_Data)_мировой_рынок
2. https://ru.wikipedia.org/wiki/Hadoop
3. https://m.habr.com/ru/post/240405/
4. https://www.ibm.com/developerworks/ru/library/bd-hadoopyarn/index.html
5. Kimball R. The Data Warehouse Lifecycle Toolkit, 2nd Edition: Practical Techniques for Building Data Warehouse and Business Intelligence Systems/ Kimball R., Ross M., etc. – John Wiley & Sons, 2008.