7. Документо-ориентированные базы данных. CouchDB, MongoDB, Redis. 8. Системы обработки данных Map-Reduce.


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.
П
П
р
р
а
а
в
в
и
и
т
т
е
е
л
л
ь
ь
с
с
т
т
в
в
о
о


Р
Р
о
о
с
с
с
с
и
и
й
й
с
с
к
к
о
о
й
й


Ф
Ф
е
е
д
д
е
е
р
р
а
а
ц
ц
и
и
и
и




Ф
едерально
е
государственно
е
автономно
е
образовательно
е
учреждени
е
высшего

профессионального

образования


"
Национальный

исследовательский

университет


"
Высшая

школа

экономики
"



Ф
Ф
а
а
к
к
у
у
л
л
ь
ь
т
т
е
е
т
т


Б
Б
и
и
з
з
н
н
е
е
с
с
-
-
и
и
н
н
ф
ф
о
о
р
р
м
м
а
а
т
т
и
и
к
к
и
и


О
О
т
т
д
д
е
е
л
л
е
е
н
н
и
и
е
е


П
П
р
р
о
о
г
г
р
р
а
а
м
м
м
м
н
н
о
о
й
й


и
и
н
н
ж
ж
е
е
н
н
е
е
р
р
и
и
и
и
Программа
научно
-
исследовательского семинара


Управление данными и знаниями


для направления
2310
00.62


Программная инженерия

подготовки бакалавра




Автор программы

доцент, к.т.н.
А.Д. Брейман


abreyman
@
hse
.
ru




Рекомендована секцией УМС

по бизнес
-
информатике

Председатель


_______________________________

«___» ___________________ 2012

г.

Одобрена на заседании кафедры

Управления разработкой программного
обеспечения

Зав. кафедрой

_____________
__
_
С.М.Авдошин

«___» ___________________ 2012

г.


Утверждена УС факультета

Бизнес
-
информатики

Ученый секретарь

___________________
_____________

« ____» _________________ 2012

г.



Москва


20
1
2




2

I
. Пояснительная записка


Автор программы
:

доцент, к.т.н. А.Д. Брейман


Общие сведения о
научно
-
исследовательском семинаре
:

Научно
-
исследовательский

семинар проводится для студентов

бакалавриата отделения программной инженерии ф
акультета бизнес
-
информатики НИУ
ВШЭ

на протяжении
всех четырех лет обучения.

На каждом курсе научно
-
исследовательский

семинар проводится в
течение всех четырех модулей учебного года.
Прод
олжительность
семинара
в
каждом
учебном году
составляет
64

аудиторных учебных часа

в форме
практических занятий и
44

ч
асов

самостоятельной работы.
Рубежный
контроль


зачет в конце
четвертого модуля.

Количество
кредитов


3 (учитываются только в кумулятивном рейтинге).


Требования к студентам
:

Научно
-
исследовательский

семинар предполагает участие студентов всех
курсов,

в том числе первого курса, начиная с первого модуля.
Изучение
дисциплины базируется на знаниях, полученных студентам при освоении
математики и информатики в объеме школьной программы
.


Цель
научно
-
исследовательского
семинара
:

Целью семинара является
формирование у студентов профессиональных
компетенций, связанных как с общей методологией научного
исследования, так

и с частными аспектами
анализа, исследования и
использования моделей и методов
управления данными

и знаниями
;
и
приобретения практических н
авыков самостоятельного научного
исследования в области создания эффективных информационных систем

на основе баз данных

и знаний
.


Аннотация
:


Научно
-
исследовательский семинар в аспекте общей методологии
научного исследования
ориентирован на
ознакомление у
частников с
основными этапами научного исследования, такими как предварительный
анализ литературы (состояние проблемы), формулировка постановки
задачи исследования, разработка собственных решений и их
сравнительный анализ с существующими аналогами, коррект
ная
формулировка полученных результатов, их оформление и презентация.

В аспекте тематики семинара «Управление данными и знаниями»
предполагается знакомство участников с современными методами
организации
централизованных и распределенных
баз данных
, в том
числе пространственных, темпоральных, потоковых и высокой
доступности, с методами организации массовой параллельной обработки

3

данных,
с моделями представления знаний и методами логического
вывода, с «мягкими» методами машинного обучения, с технологиями
сем
антического веба.

Семинар проводится в форме докладов участников с их последующим
обсуждением по принятым в научном сообществе правилам ведения
дискуссий. Участие в семинаре поможет студентам при освоении базовой
дисциплины «Базы данных»

и подготовит их к
проведению собственных
научных исследований, а также выполнению курсовых и дипломных
работ.


З
адачи
научно
-
исследовательского семинара
:

В результате
участия в семинаре
студенты
могут приобрести следующие
компетенции
:



по общей методологии научного
исследования
:



овладеть базовыми умениями и навыками ведения самостоятельных
исследований на примере управления данными и знаниями
;



получить навыки выступлений с научными докладами, оформления
содержательных презентаций и научиться корректно вести научные
д
искуссии
;



по тематике научного семинара
:



иметь представление о современном состоянии и тенденциях

развития систем управления базами данных

и знаний
;




получить углубленные знания в области методов организации
хранения, индексирования и поиска
данных;



получ
ить знания о современных классах систем управления базами
данных
;



получить знания о современных распределенных системах хранения
данных высокой доступности и массовой праллельной обработки
данных
;



ознакомиться с методами управления знаниями, моделями
предс
тавления знаний и организацией механизмов логического
вывода
;



приобрести знания о методах машинного обучения
;



получить представление о моделях, методах и средствах, лежащих в
основе семантического веба
.


II
.
Содержание семинара



Участникам семинара
предлагаются для обсуждения и последующего
исследования следующие крупные тем, каждая из которых допускает
достаточно широкую детализацию и богатый выбор конкретных примеров и
задач.

1.

Методы индексирования данных
.
B
-
Tree
,
Bitmap
,
Hash
.

2.

Пространственные баз
ы данных.
Пространственные индексы.

3.

Темпоральные базы данных
.
T
-
SQL
2.


4

4.

Системы управления потоками данных
.
TelegraphCQ
,
Borealis
,
STREAM
.

5.

Распределенные транзакционные базы данных
.

Двухфазная фиксация
транзакций 2
PC
.

6.

Распределенные базы данных высокой
доступности. Теорема

CAP
.
DHT.
Google BigTable, Dynamo
, Cassandra
.

7.

Документо
-
ориентированные базы данных
.
CouchDB
,
MongoDB
,
Redis
.

8.

Системы обработки данных
Map
-
Reduce
.
Hadoop, HBase.

9.

Модели представления знаний и механизмы вывода
.
Логические модели,
продукции, семантические сети, фреймы.


10.

Методы машинного обучения
. Нейронные сети. Эволюционные
алгоритмы. Нечеткая логика.

11.


Семантический веб.
Средства описания онтологий
.



Ι
II
.
Рекомендуемая литература

1.

Кузнецов С.Д. Базы данных. Модели и языки.


М.:Бином
-
Пресс, 2008.


720с.

2.

Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и
сопровождение. Теория и практика 3
-
е изд.


М.: Вильямс, 2003.


1436с.

3.

Крёнке

Д. Теория и практика построения баз данных. 9
-
е изд.


СПб.:Питер,
2005.


864с.

4.

Пирогов В.Ю. Информационные системы и базы данных: организация и
проектирование.


СПб.:БХВ
-
Петербург, 2009.


528с.

5.

Шекхар Ш., Чаула

С. Основы пространственных баз данных.


М.:КУДИЦ
-
Образ, 2004.


336с.

6.

Когаловский М.Р. Энциклопедия технологий баз данных. Эволюция
технологий, технологии и стандарты, инфраструктура, терминология.

М.:
Финансы и статистика, 2003.
-
800с.

7.

Рассел

C
., Норвиг

П.
Искусственный интеллект: современный подход
.

М.:Вильямс, 2006.


1408с.

8.


Осипов Г.С. Лекции по искусственному интеллекту


М.: УРСС, 2009.

272 с.

9.


Рыбина Г.В. Основы построения интеллектуальных систем
.


М.: Финансы
и статистика, 2009.



432 c.

10.

Кома
рцова Л.Г., Максимов А.В. Нейрокомпьютеры. 2
-
е изд.


М.: МГТУ
им. Н.Э.Баумана, 2006.


400 с.

11.

Яхъяева Г.Э. Нечеткие множества и нейронные сети: учебное пособие для
вузов.


М.:Интернет
-
университет информационных технологий


ИНТУИТ.ру, 2006.


320 с.

12.

Рутк
овская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические
алгоритмы и нечеткие системы.


М.:Горячая Линия
-

Телеком, 2006.


452с.

13.

Усков А.А., Кузьмин А.В. Интеллектуальные технологии управления.
Искусственные нейронные сети и нечеткая логика.


М.: Горячая Линия
-

Телеком, 2004.


144 с.


5

14.

Hoffer, Jeffrey A., Prescott, Mary B, McFadden, Fred R. (2007), Modern Database
Management. 8
th

ed.


Upper Saddle River, New Jersey: Pearson
Education Inc
.

15.

Ramakrishnan, Raghu, Gehrke, Johannes (2002), Databas
e Management Systems.
3
rd

ed.


New York: McGraw
-
Hill.

16.

Celko, Joe (1999),
Joe Celko's Data and Databases: Concepts in Practice
.


San
Francisco:
Morgan Kaufmann Publishers.


17.

Hay, David C. (1996), Data Model Patterns. Conventions of Thought.


New
York:
Dorset House Publishing.


18.

Davies,
John,
Fensel,
van Harmelen,
Frank (2003),
Towards the Semantic
Web: Ontology
-
Driven Knowledge Management
.


John Wiley & Sons

19.


Allemang, Dean, Hendler, James (2008), Semantic Web for the Working
Ontologist: Effecti
ve Modelling in RDFS and OWL.


Morgan Kafmann.

352
pp.

20.

Центр

информационных

технологий


ЦИТ

Форум
”.
Базы

данных
.
http
://
www
.
citforum
.
ru
/
database

21.

TimeCenter


international center for the support of temporal

database applications
http://timecenter.cs.aau.dk/

22.

TelegraphCQ
http://telegraph.cs.berkeley.edu/telegraphcq/v0.2/

23.

Borealis
.
Distributed

Stream

Processing

Engine

http://www.cs.brown.edu/research/borealis/public/

24.

Stanford STREAM Data Manager
http://infolab.stanford.edu/stream/

25.

Browne J.

Brewer’s CAP Theorem
http://www.julianbrowne.com/article/viewer/brewers
-
cap
-
theorem

26.

Chord: A Scalable Peer
-
to
-
peer Lookup Service for Internet Applications
http://pdos.csail.mit.edu/papers/chord:sigcomm01/

27.

Bigtable: A Distributed Storage System for Structured Data
http://labs.google.com/papers/bigtable.html

28.

Apache Cassandra
http://cassangdra.apache.org

29.

Dynamo: Amazon’s Highly Available Key
-
value Store

http://www.allthingsdistributed.co
m/files/amazon
-
dynamo
-
sosp2007.pdf

30.

CouchDB
http://couchdb.apache.org

31.

MongoDB
http://www.mongodb.org

32.

Redis
http://redis.io

33.

Riak
http://wiki.basho.com/

34.

Dean J., Ghemawat S.
MapReduce: Simplified Data Processing on Large Clusters
http://labs.google.com/papers/mapreduce.html

35.

Apache Hadoop
http://hadoop.apache.orgh

36.

HBase
http://hbase.apache.org

37.

Sowa, John F. Semantic Networks

38.

OWL Web Ontology
Language Reference

http://www.w3.org/TR/owl
-
ref/

39.

The Rule Markup Initiative
http://ruleml.org/

40.

Description Logics
http://dl.kr.org




6

V
. Формы контро
ля

Текущий контроль:

учет посещаемости семинара и оценка

качества подготовки
и активности
(доклады, презентации, оппонирование, критические выступления
,
решение задач и реализация компьютерных программ
).

При непосещении
занятий ставится оценка «0».

Рубежный

контроль:

зачет в конце 4 модуля в форме научной конференции



доклады участников семинара о проведенных исследованиях с презентацией
полученных результатов. Дополнительно учитываются выступления на научных
конференциях и публикации в журналах и с
борниках научных трудов.


Перевод в пятибалльную оценку осуществляется в соответствии со
следующей таблицей
:

Таблица соответствия оценок по десятибалльной и пятибалльной шкалам

По десятибалльной шкале

По пятибалльной шкале

1


неудовлетворительно

2


очень плохо

3


плохо

2


неудовлетворительно

4


удовлетворительно

5


весьма удовлетворительно

3


удовлетворительно

6


хорошо

7


очень хорошо

4


хорошо

8


почти отлично

9


отлично

10


блестяще

5


отлично



Автор программы
:

_________________________ Брейман А.Д.


Приложенные файлы

  • pdf 7699602
    Размер файла: 235 kB Загрузок: 1

Добавить комментарий