Воскресенье, 22.10.2017, 19:08

САПР
Программы
 Инструмент Data Mining: общий обзор STATISTICA Data Miner

STATISTICA Data Miner содержит наиболее полный набор методов Data Mining на рынке программного обеспечения!


Эффективная и удобная в использовании система STATISTICA Data Miner содержит удобные инструменты для всего процесса Data Mining – от построения запросов к БД до создания итоговых отчетов. Результаты рейтингов


Text MinerСм. также STATISTICA Text Miner - расширенная версия продукта STATISTICA Data Miner для анализа неструктурированной текстовой информации (Text Mining).

Основные характеристики: уникальные особенности STATISTICA Data Miner

Data Mining со STATISTICA предлагает множество возможностей и методов, недоступных другим конкурирующим продуктам. Эти функции могут иметь решающее значение для максимизации ROI (коэффициент доходности бизнеса) в конкурентной среде.

STATISTICA Data Miner может быть использован как новичками, которым предлагается автоматическое построение моделей с помощью Мастера Data Mining (Data Miner Recipes), так и экспертами, которым предоставляется самый широкий выбор методов и технологий для решения даже самых сложных задач.

STATISTICA Data Miner является наиболее универсальным средством Data Mining, что дает Вам все необходимые инструменты для быстрого понимания критически важных процессов и немедленного воздействия на ROI.

STATISTICA Live Score ®, дополнительный инструмент анализа данных, обеспечивающий эффективный способ внедрения моделей Data Mining.

STATISTICA Data Miner оптимизирован для работы с большим объемом данных, а также в последней версии продукта было уменьшено время вычислений, повышена масштабируемость и производительность. Инструменты для обработки очень большого объема данных эффективны, благодаря использованию многопоточности. (см. таблицу сравнения)

Обзор

На сегодняшний день в STATISTICA Data Miner представлен широкий набор методов кластеризации, архитектур нейронных сетей, деревьев классификации и регрессии (также называемые рекурсивными методами секционирования), многомерного моделирования (в том числе МАР-сплайны MARS, машинное обучение SVM), анализ последовательностей, ассоциаций и связей (в виде надстройки), и даже методы симуляции и оптимизации процессов.

STATISTICA Data Miner также предоставляет большой набор графиков и процедур визуализации, для обеспечения эффективного визуального Data Mining.



STATISTICA Data Miner может обрабатывать, считывать и записывать данные практически всех стандартных форматов (файлов). Может получить непосредственный доступ к базам данных (даже без выполнения явных операций импорта/экспорта), а также импортировать и экспортировать файлы из продуктов более старых версий (или конкурирующих).

STATISTICA Data Miner предоставляет также эффективные инструменты предварительной обработки, чистки и фильтрации данных для эффективного отбора признаков из тысяч (или даже миллионов) возможных предикторов, автоматического оптимального соединения, объединения нескольких источников данных с выравниванием данных, зависимых от нескольких критериев, включая временные штампы в неравные интервалы (агрегирование данных, ETL), обработки пропущенных (недостающих) данных, удаления повторных записей, выбросов и т.д.

STATISTICA Data Miner предоставляет мастер (Data Miner Recipes) для быстрого получения полезных решений; STATISTICA Data Miner также предоставляет хорошо знакомое рабочее пространство с drag-and-drop интерфейсом для создания собственных проектов Data Mining, полностью программируемых и настраиваемых, обеспечивает интерактивное бурение данных для получения промежуточных и окончательных результатов.

STATISTICA Data Miner может генерировать прогнозирующие модели в различных форматах, включая PMML, C++ (C#), Java и другие языки программирования/скоринга (например SAS, хранимые процедуры базы данных). Инструмент STATISTICA Быстрое внедрение (Rapid Deployment) позволяет вам непосредственно перейти от моделирования к применению и скорингу оперативных данных, баз данных и т.д.

STATISTICA Data Miner полностью интегрирован со всей линейкой продуктов STATISTICA. К примеру, STATISTICA Data Miner может использоваться для оптимизации процесса и усовершенствования модели мониторинга процесса, автоматического скоринга оперативных данных в STATISTICA Enterprise.

STATISTICA Data Miner может быть использован в качестве приложения для рабочей станции или в рамках мощной архитектуры клиент-сервер (для вычислений на серверах, основанных на параллельной обработке нескольких процессов анализа, с балансировкой нагрузки для управления большим количеством пользователей, и инструментами для планирования пакетных задач и процессов).

Data Mining: Подробнее о STATISTICA Data Miner


STATISTICA Data Miner включает всеобщие реализации деревьев, растущих деревьев, случайных лесов классификации и регрессии, автоматизированный поиск нейронных сетей, метод K ближайших соседей, метод машинного обучения на опорных векторах, различные методы кластерного анализа, сети Кохонена, метод частных наименьших квадратов PLS, обобщенные линейные модели, алгоритмы анализа последовательностей, ассоциаций и связей для транзакций БД.

Методы предназначены для автоматической оценки конкурентных моделей, для вычисления среднего прогноза всех моделей.

Применяется расширенное ненормальное и многомерное моделирование и оптимизация для получения окончательной модели Data Mining. К примеру, для оптимизации кампании, процесса/производства.

В дополнение, интегрирует различные методы и технологии в проекты Data Mining – карты контроля качества, анализ пригодности процесса, анализ Вейбулла, анализ мощности, линейные и нелинейные модели. Все процедуры STATISTICA могут быть использованы в проектах Data Mining, это не требует программирования или дополнительных разработок.

Все процедуры STATISTICA могут быть запрограммированы, например, с помощью макросов STATISTICA Visual Basic. Программы также могут использовать сторонние библиотеки и приложения, например алгоритмы, доступные в популярном пакете R.

Подробнее о визуальном Data Mining

Все уникальные и непревзойденные графические возможности STATISTICA доступны для Data Mining, основанном на исходных данных, полученных промежуточных данных и итоговых таблицах результатов.

Доступно средство Кисть, масштабирование, выделение на нескольких графиках.

Доступны сотни типов графиков для визуализации данных после чистки, бурения и расслоения.

Создание итоговых и сравнительных графиков даже для больших источников данных.

Подробнее о доступе к данным

STATISTICA Data Miner обладает способностью обрабатывать одновременно несколько потоков данных в едином процессе; объединять, выравнивать, агрегировать данные.

STATISTICA Data Miner оптимизирован для обработки очень больших выборок данных, и включает в себя уникальные возможности предпросмотра более миллиона параметров/переменных и/или создания стратифицированной или простой случайной выборки с использованием DIEHARD-сертифицированной процедуры создания случайной выборки.

STATISTICA Data Miner предоставляет высоко оптимизированный интерфейс чтения (и записи) БД большого объема, включающий технологию IDP (In-Place Database Processing). Данная технология позволяет асинхронно считывать информацию непосредственно с удаленных серверов баз данных (с использовании распределенной обработки, если она поддерживается сервером), минуя необходимость "импортировать" данные и создавать локальную копию.

Практически все широко используемые форматы файлов могут быть импортированы и экспортированы (включая текстовые, Excel, SAS, SPSS, а также большинство форматов баз данных).

Также поддерживаются разнообразные специальные форматы баз данных, такие как OSI PI (применение методов Data Mining для оптимизации непрерывных процессов).

Подробнее о предварительной обработке данных

STATISTICA Data Miner предоставляет инструменты для автоматического обнаружения и обработки выбросов, нестандартных наблюдений, разреженных данных.

Эффективный автоматический Отбор признаков обеспечивает быстрое обнаружение важных переменных (входных параметров) даже среди более миллиона возможных предикторов (параметров).

Различные инструменты позволяют обрабатывать пропущенные данные, например автоматически заменяя их, используя метод k-ближайших соседей.

Эффективные инструменты для оптимального объединения предикторов, категорий.

Опционально предоставляется функционал для выравнивания, объединения, агрегирования множественных источников данных, например, временных данных процессов группового изготовления, баз данных транзакций.

Эффективный язык трансформирования и редактор позволяют преобразовывать данные за один проход (включая сдвиг, операции с датами и временем, текстовым операциям, выражения с логическими операторами).

STATISTICA Data Miner представляет собой открытую архитектуру с неограниченными возможностями автоматизации, поддерживающую пользовательские расширения (например, с использованием Visual Basic (встроенного), Java или C/C++/C#), что позволяет пользователю применить даже самые сложные алгоритмы предварительной обработки данных или использовать сторонние библиотеки, такие как популярный пакет R.

Подробнее о пользовательских интерфейсах

STATISTICA Data Miner предлагает выбор пользовательских интерфейсов и функциональных возможностей, гибко переключаемых между собой в зависимости от задачи. Благодаря этому специальные интерфейсы обеспечивают построение последовательности аналитических процессов, со стандартными «рецептами» Data Mining, или одновременное выполнение интерактивных специальных анализов с несколькими входами данных и промежуточными результатами, с использованием любой комбинации из сотен методов и графиков.

STATISTICA Data Miner предоставляет простой в использовании, drag-and-drop пользовательский интерфейс для создания последовательности аналитических процессов, которые могут быть использованы даже новичками.

Программа также включает в себя альтернативный, простой в использовании, пользовательский интерфейс типа «Мастер», позволяющий строить модели согласно «рецептам» и передовым практикам Data Mining (Data Miner Recipes).

Для детального и комплексного анализа, программа предоставляет мощные, интерактивные инструменты исследования данных (бурение, расслоение), включая широкий набор интерактивных разведочных средств визуализации.

Все функциональные возможности STATISTICA Data Miner (как и всех продуктов STATISTICA) также доступны в виде программного интерфейса, как внутри приложения (с помощью STATISTICA Visual Basic), так и из других приложений (C++, C#, VB.NET).

Результаты могут быть сохранены в виде отчетов в формате документов MS Word, PDF, таблиц Excel или в высокоэффективном формате Рабочей книги STATISTICA.

Подробнее о внедрении моделей

STATISTICA Data Miner содержит множество функциональных возможностей для гибкого внедрения прогностических моделей.

Программа может генерировать PMML (Predictive Models Markup Language) файлы, основанные на XML, для прогнозирования, предсказательной классификации или кластеризации больших объемов данных.

Функционал для генерации предсказательных моделей в коде языков C (C++,C#), Java, SAS или в формате хранимых процедур баз данных (версия 9.1 или выше).

STATISTICA Data Miner может также записывать предсказанные значения, классификации, вероятности классификации, остатки прогнозирования, принадлежность к кластерам и её вероятности, и другие результаты непосредственно во внешние базы данных для последующих анализов, выборок, с помощью эффективной технологии IDP (In-Place Database Processing) чтения/записи информации из/во внешние базы данных.

Инструмент STATISTICA Data Miner, Быстрое внедрение (Rapid Deployment), позволяет строить ROC кривые (показывающие соотношение между "истинными" и "ложными" предсказаниями модели) и карты прибыли (суммирующие стоимость и оцененную прибыль, основанную на использовании моделей) для оценки внедрения моделей Data Mining.



Подробнее о платформах, интеграции решений в STATISTICA

STATISTICA Data Miner можно запустить как на рабочей станции, так и на сервере.

Для серверной установки доступен веб-интерфейс.

Настроенный на рабочей станции анализ (проект Data Mining, "рецепт" Data Mining) может быть выгружен на сервер для обработки. Результаты будут получены после завершения выполнения анализа на сервере.

STATISTICA Data Miner полностью интегрирован со всеми решениями STATISTICA.

Серверная установка STATISTICA Data Miner может использовать клиент-серверную архитектуру WebSTATISTICA для параллельного вычисления и расширенной балансировки нагрузки (между серверами).

При использовании платформы STATISTICA Enterprise, модели Data Mining для прогнозирования (или скоринга) могут быть сохранены непосредственно в защищенном хранилище отчетов, шаблонов анализов и т. д., и опубликованы для авторизованных пользователей по всему предприятию.

Продукты STATISICA позволяют легко интегрировать технологии анализа данных и Data Mining в корпоративную аналитическую систему для создания интеллектуальных систем мониторинга, скоринга и т. д.

Вывод

STATISTICA Data Miner является уникальным приложением с точки зрения полноты, мощности, технологичности, гибкости имеющихся пользовательских интерфейсов.

Никакие другие приложения Data Mining не позволят Вам так быстро преобразовать "сырые данные" в эффективные, действенные решения и знания за счет применения передовых методов и алгоритмов.
Мы здесь
start@ing-tv.ru
+7(950) 402-03-19
+7(391) 231-25-60
 
Инженерные сети
Расчетные САПР
Программы SoftHVAC
Энергоэффективност
GeoSolution

Copyright Weißes Meer © 2017