Кируля Аскалонская (kirulya) wrote,
Кируля Аскалонская
kirulya

Categories:

Интервью с сыном

Будущее науки данных (Data Science): что мы думаем о нем?
(оригинал тут)

Большие данные (Big Data) стали горячей темой, поскольку информационный век взял мир штурмом в 21-м веке. А потом быстро последовало рождение "ученого данных" (“data scientist”) как профессии, которая может справиться с этим потоком информации. Наш бывший сотрудник DJ Патил придумал это название в 2008 году.

Data Science, как дисциплина, резко выросла, и наш Главный Научный Сотрудник по этой науке, Виталий Гордон, спокоен за ее будущее. Виталий в настоящее время ведет нашу научную группу данных на SalesforceIQ. Группа разрабатывает сложные инструменты машинного обучения для повышения интеллектуального уровня Customer Success Platform.

Мы сели с Виталием побеседовать, и он представил свою точку зрения на то, каким он видит будущее Data Science.




В наши дни мы регулярно слышим название " data scientist". Почему это название стало обычным для компаний?

"Data Scientist" является относительно новым термином, но это не означает, что специалистов по данным раньше не существовало. Были специалисты по анализу данных, интеллектуальным данным, инженеры. Этим занимались Google и Amazon. И прежде, чем это стало называться " Data Science", существовали компании, в которых управляли данными.

Как отмечают многие люди, нынешний век - это век информации. Data science - это то же самое, что и социальные средства коммуникации менеджеров маркетинга. Раньше социальные медиа не существовали, но, изменения отрасли и потребностей доказали, что они нужны, так как они образует определенную функцию – профессию социального медиа-менеджера. Та же ситуация для data science.

Где, на ваш взгляд, будет data science в будущем?

Давайте посмотрим на то, где data science теперь. В последние несколько недель, Google создал искусственный интеллект, который победил чемпиона мира по Го Lee Sedol.

В 1997 году суперкомпьютер от IBM Deep Blue победил чемпиона мира по шахматам Гарри Каспарова в матче из шести игр.

Но на этот раз, есть существенное отличие нынешнего матча от матча в 1997 году, потому что Deep Blue был экспертной системой, что это, я объясню ниже. Deep Blue учился у великих шахматных игроков, чтобы играть в шахматы, но система DeepMind Go научила играть в Го сама себя. В системе не было много специалистов, участвующих в играх, так что этот успех является сногсшибательным прорывом.

По сравнению с шахматами, нынешний успех – это еще большее продвижение в будущее. Для машин, на самом деле, шахматы не так сложны, как игра в Го. В Go невозможно предугадать каждый возможный ход. И вместо того, чтобы отличает игру экспертов от игры начинающих игроков в Го, у машины проявилось чувство интуиции.

Когда Google’s AI обыграла Lee Sedol, это показало, что теперь машины могут имитировать чувство интуиции.

Так что же дальше?

Дело в том, что мы даже не понимаем, насколько великой станет data science.
Вы можете представить себе многие вещи: компьютеризированных юристов, компьютеризированную медицину. Подумайте о компьютеризации решений венчурного капитала, инвестируемого в стартапы.

Вы даже можете получить произведения искусства, музыки, созданные компьютерами, а также статьи, неотличимые от статей, написанных человеком.
Идут философские дебаты об искусственном интеллекте. Похожи ли обучающиеся компьютеры с ИИ на людей? Или они годны только на то, чтобы лучше выполнять задачи?

Таким образом, data science будет настолько больше, чем сейчас, что вы сможете увидеть широкий спектр применения ее в будущем, который даже еще не изучен.

Что такое различие между ИИ, машинным обучением и data science?

Искусственный интеллект представляет собой широкий термин, который означает любой интеллект, которым управляет компьютер. Машинное обучение является его подразделом, но вам не нужно машинное обучение, чтобы иметь искусственный интеллект.

Например, что такое ИИ, без машинного обучения?

Хорошим примером являются поисковые запросы. Еще GPS. В GPS, например, когда вы задали пункт назначения, прибор вычисляет наилучший путь для вас. Это действие не обязательно требует машинного обучения, так как то, что он делает, это просто вычисляет быстрее, чем способны люди, а не демонстрирует способность к обучению на основе данных.
Например, Google AI, который победил в Go чемпиона X, не нужно было потреблять данные, чтобы учиться и совершенствоваться.
Вы можете научить машину другим методам.

Должны ли быть у машины Big Data, чтобы иметь возможность использовать data science?

Нет, например, вы можете работать со многими клиентами, и каждый клиент имеет небольшой набор данных. Это data science, которая работает, чтобы решить многие небольшие проблемы данных одновременно.
Но, есть некоторые проблемы, которые присущи только большим наборам данных. Возьмем язык и перевод с одного языка на другой. У людей занимает много лет понять язык. Вы, наверное, имеете опыт изучения второго языка – это занимает годы освоить все правила и исключения. Некоторые проблемы вы можете легко решить своей способностью проникать в суть, но для вещей с дополнительной структурой? Вот когда нужна Big Data.

Прежде чем заниматься машинным обучением и data science, мы основали нечто под названием «экспертные системы», как я уже говорил ранее. Это были, в основном группы экспертов, которые привили машинам знания в форме правил и логики. Это - нормальное состояние, при котором сначала устанавливаются правила.

Машины будут знать больше, а с большими данными, они получат более богатое хранилище опций для вычислений.

Во второй части мы обсудим с Виталием, что мы можем сделать, чтобы подготовить себя к будущему data science. Подойдут ли вы и ваш бизнес к миру, который запускается на смарт-инструментах и интеллектуальных приложениях?

(с) Дженнифер Bi
Tags: дети в Америке
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 12 comments