Стивен бробст, teradata: «даже в кремниевой долине многие аналитики больших данных — русские»

Стивен бробст, teradata: «даже в кремниевой долине многие аналитики больших данных — русские»

Стив Бробст — основной технический директор корпорации Teradata и просто один из немногих людей, говорящих о Big Data на языке, понятном простым смертным. Bankir.Ru поболтал с ним о том, заменят ли «громадные эти» умелых банкиров, не начнут ли регулировать data mining, и из-за чего сам термин Big Data неверен. — Годом ранее вы заявили, что Big Data — больше маркетинговая история, чем что-то применимое на практике. Изменилось ли ваше вывод с того времени?

— Практичности с того времени заметно прибавилось. То, что продемонстрировало полезность на уровне концепций, начало внедряться в коммерческие продукты.

Но мне, как и годом ранее, не нравится сам термин Big Data. Дело-то не в количестве данных, а в их разнообразии, и в том, какие конкретно полезные для себя возможности вы имеете возможность из этого разнообразия извлечь. В случае если же люди копаются в огромных количествах однородных и достаточно ненужных данных и именуют это «работой с Big Data»… Нет, это что-то второе.

Работа с громадными данными начинается, в то время, когда ты берешь некоторый комплект информации, на что раньше по большому счету ни при каких обстоятельствах не наблюдал. Неструктурированные тексты, голосовые записи, какие-то логи. И извлекаешь из них что-то занимательное и нужное.

Лишь для этого нужно вынудить себя мыслить принципиально в противном случае, по причине того, что стандартные подходы к анализу данных полностью точно не сработают.

Через три года сам термин Big Data уйдет из потребления.

По моему личному точке зрения, через три года сам термин Big Data уйдет из потребления. В Российской Федерации еще применяют слово «смартфон», но в Штатах мы уже говорим легко «телефон». По причине того, что все телефоны кругом — смартфоны.

Пять лет назад такое уточнение имело суть в силу разнообразия сотовых телефонов. Сейчас уже нет.

То же самое будет с Big Data. Эти прекратят разделяться на структурированные и неструктурированные, «громадные» и «мелкие». Работа с разрешёнными будет подразумевать применение всех разновидностей информации и извлечение пользы из их синергии.

Никаких Big Data. Легко — Data

— В Российской Федерации по большому счету много изюминок. Мы не только именуем смартфоны смартфонами. У нас, например, в полной мере открыто продаются информацию о людях, собранные именно на базе анализа разрозненной информации о них. Теоретически, эти сведенья обезличены, но грань до перехода на личности так узка, что, думается, перейти ее — дело одного клика. Не преобразовывается ли Big Data, либо, в случае если угодно, Data, в легальный инструмент подглядывания за личной судьбой?

И не придет ли скоро государство регулировать процесс анализа Big Data? Огромные подборки личной информации о людях показались задолго перед тем, как придумали термин Big Data.

— В действительности, государство само трудится с этими данными, и достаточно удачно. Параллельно замечая за тем, как с ними трудятся коммерческие компании. Кстати, огромные подборки личной информации о людях показались задолго перед тем, как придумали термин Big Data, к примеру у телеком-операторов, социальных сетей, разработчиков мобильных платформ и т. д. Разработчики совокупностей навигации также в большинстве случаев знают, где вы и что делаете. И вы, кстати, не протестуете.

А в то время, когда не желаете, дабы за вашими перемещениями следили, геолокацию. У Гугл столько различной информации о пользователях, что голова кругом. Так, мы платим за удобство приватностью, и достаточно давно.

Недавние события в Париже вынудили многих дать согласие с мыслью, что приватность приватностью, но у страны должны быть возможности нарушать ее для неспециализированного блага. К примеру, если бы была возможность заблаговременно прочесть переписку террористов, применявших мессенджер Telegram, все имело возможность сложиться в противном случае.

Анализ неструктурированных данных это только еще один метод получить данные, которая имеется у большинства. И в случае если дойдет дело до регулирования, ничего принципиально нового изобретать не придется.

— На конференции Teradata в Анахейме у меня была возможность побеседовать с банковскими экспертами из различных государств. И все они говорили приблизительно одно да и то же: «Да, Big Data — это весьма перспективно, интересуемся, пробуем, но внедрений до тех пор пока нет». Быть может, вы понимаете какие-то успешные примеры из отечественной сферы?

— Возможно, я вас не весьма поражу, в случае если сообщу, что банковская отрасль проходит на данный момент через цифровую изменение. В древности были банковские отделения, много-много отделений, куда люди ходили годами. В том месте их неспешно начинали выяснять в лицо, знали об их трудностях и делах.

Но времена изменились. Молодежь не желает ходить в отделения, подстраиваться под их расписание, ожидать в очереди. И сейчас на смену сотруднику банка, выясняющему клиента, приходит приложение либо интернет-банк, кроме этого имеющие представление об активностях клиента, на базе которых возможно предположить его предстоящие действия.

Одним из полезнейших источников информации о клиенте есть общение в чате.

Кстати, одним из полезнейших источников информации о клиенте есть общение в чате, что на данный момент довольно часто встраивается в веб и приложения-страницы банка. По причине того, что в том месте в большинстве случаев обсуждается что-то спонтанное, с громадным потенциалом для развития. Но тут имеется второй нюанс: люди в большинстве случаев пишут в чатах разговорным языком, с потреблением слэнга, сокращений и просто не весьма грамотно.

Живой человек все это принимает нормально, но при автоматическом анализе появляется много трудностей.

В случае если мы еще раз отыщем в памяти стародавние времена, в то время, когда мне был нужен кредит, я надевал собственный ботинки и лучший костюм, брал у привычного часы и солидный портфель, и во всем этом великолепии шел в банк. В том месте я, само собой разумеется, предъявлял разные бумажки о моем денежном состоянии, но чувство, которое мой экстерьер создавал на сотрудника банка, игралось очень ключевую роль.

Цифровые эти разрешают принимать решения, не опираясь на какие-то субъективные вещи. К примеру, я могу взять кредит, по большому счету не приходя в банк. Либо придя в него в любимой гавайской рубахе.

И ту сумму, которую вправду потяну, а не ту, что мне хотелось бы, и которая имела возможность бы обрушить мой бюджет на многие годы вперед.

Лучше ли таковой вариант, в то время, когда субъективные факторы заменяются сухими данными? На мой взор, значительно лучше. И для банка, и для клиента.

Ловчить, само собой разумеется, при таких условиях весьма тяжело. Но об удобстве для ловчил мы думаем в последнюю очередь.

— Другими словами получается, умные умелые банковские сотрудники не так долго осталось ждать по большому счету не будут необходимы?

— Ни за что. Еще как будут необходимы. Но не чтобы сидеть за столом в зале и выдавать кредиты.

Скорее, их знания и опыт пригодятся для наладки совокупности, которая будет делать это вместо них. Для выбора данных, анализ которых разрешит принять верное ответ.

— А русская Big Data отличается от, например, американской? Кроме того Big Data в Нью-Йорке очень резко отличается от Big Data в Сан-Франциско.

— В действительности, кроме того Big Data в Нью-Йорке очень резко отличается от Big Data в Сан-Франциско. Понимаете, у нас в Калифорнии не считается чем-то нехорошим, в случае если придуманный тобой стартап не известно почему не взлетает. Все благодарят друг друга, пожимают руки и идут дальше. Кроме того банку в Калифорнии не зазорно в чем-то совершить ошибку. Запрещено совершить ошибку два раза в одном и том же, по причине того, что это уже значит, что ты не может обучаться.

Но один раз — возможно. Так, неудачи — это часть образования.

Уже в Нью-Йорке к неудачам относятся куда менее терпимо. Другими словами в том месте готовы использовать некие прорывные разработки, но лишь по окончании того, как они пройдут обкатку где-то еще.

В Европе, к примеру в России и Германии, неудача переживается совсем болезненно. И о том, дабы внедрить в банке что-то занятное и взглянуть, приживется либо нет, обращение в большинстве случаев по большому счету не идет. По причине того, что неудачи не забывают и припоминают.

Одновременно с этим, Российская Федерация традиционно сильна экспертами в области программирования и математики. Соответственно, имеется возможность не только ждать, пока готовые ответы дозреют где-то на большом растоянии, но и внести собственный вклад. Кроме того в Кремниевой равнине многие аналитики громадных данных — русские.

#тренды | Большие данные

Похожие статьи, которые вам, наверника будут интересны: