Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.
П
П
р
р
а
а
в
в
и
и
т
т
е
е
л
л
ь
ь
с
с
т
т
в
в
о
о
Р
Р
о
о
с
с
с
с
и
и
й
й
с
с
к
к
о
о
й
й
Ф
Ф
е
е
д
д
е
е
р
р
а
а
ц
ц
и
и
и
и
Ф
едерально
е
государственно
е
автономно
е
образовательно
е
учреждени
е
высшего
профессионального
образования
"
Национальный
исследовательский
университет
"
Высшая
школа
экономики
"
Ф
Ф
а
а
к
к
у
у
л
л
ь
ь
т
т
е
е
т
т
Б
Б
и
и
з
з
н
н
е
е
с
с
-
-
и
и
н
н
ф
ф
о
о
р
р
м
м
а
а
т
т
и
и
к
к
и
и
О
О
т
т
д
д
е
е
л
л
е
е
н
н
и
и
е
е
П
П
р
р
о
о
г
г
р
р
а
а
м
м
м
м
н
н
о
о
й
й
и
и
н
н
ж
ж
е
е
н
н
е
е
р
р
и
и
и
и
Программа
научно
-
исследовательского семинара
Управление данными и знаниями
для направления
2310
00.62
–
Программная инженерия
подготовки бакалавра
Автор программы
доцент, к.т.н.
А.Д. Брейман
abreyman
@
hse
.
ru
Рекомендована секцией УМС
по бизнес
-
информатике
Председатель
_______________________________
«___» ___________________ 2012
г.
Одобрена на заседании кафедры
Управления разработкой программного
обеспечения
Зав. кафедрой
_____________
__
_
С.М.Авдошин
«___» ___________________ 2012
г.
Утверждена УС факультета
Бизнес
-
информатики
Ученый секретарь
___________________
_____________
« ____» _________________ 2012
г.
Москва
–
20
1
2
2
I
. Пояснительная записка
Автор программы
:
доцент, к.т.н. А.Д. Брейман
Общие сведения о
научно
-
исследовательском семинаре
:
Научно
-
исследовательский
семинар проводится для студентов
бакалавриата отделения программной инженерии ф
акультета бизнес
-
информатики НИУ
ВШЭ
на протяжении
всех четырех лет обучения.
На каждом курсе научно
-
исследовательский
семинар проводится в
течение всех четырех модулей учебного года.
Прод
олжительность
семинара
в
каждом
учебном году
составляет
64
аудиторных учебных часа
в форме
практических занятий и
44
ч
асов
самостоятельной работы.
Рубежный
контроль
—
зачет в конце
четвертого модуля.
Количество
кредитов
—
3 (учитываются только в кумулятивном рейтинге).
Требования к студентам
:
Научно
-
исследовательский
семинар предполагает участие студентов всех
курсов,
в том числе первого курса, начиная с первого модуля.
Изучение
дисциплины базируется на знаниях, полученных студентам при освоении
математики и информатики в объеме школьной программы
.
Цель
научно
-
исследовательского
семинара
:
Целью семинара является
формирование у студентов профессиональных
компетенций, связанных как с общей методологией научного
исследования, так
и с частными аспектами
анализа, исследования и
использования моделей и методов
управления данными
и знаниями
;
и
приобретения практических н
авыков самостоятельного научного
исследования в области создания эффективных информационных систем
на основе баз данных
и знаний
.
Аннотация
:
Научно
-
исследовательский семинар в аспекте общей методологии
научного исследования
ориентирован на
ознакомление у
частников с
основными этапами научного исследования, такими как предварительный
анализ литературы (состояние проблемы), формулировка постановки
задачи исследования, разработка собственных решений и их
сравнительный анализ с существующими аналогами, коррект
ная
формулировка полученных результатов, их оформление и презентация.
В аспекте тематики семинара «Управление данными и знаниями»
предполагается знакомство участников с современными методами
организации
централизованных и распределенных
баз данных
, в том
числе пространственных, темпоральных, потоковых и высокой
доступности, с методами организации массовой параллельной обработки
3
данных,
с моделями представления знаний и методами логического
вывода, с «мягкими» методами машинного обучения, с технологиями
сем
антического веба.
Семинар проводится в форме докладов участников с их последующим
обсуждением по принятым в научном сообществе правилам ведения
дискуссий. Участие в семинаре поможет студентам при освоении базовой
дисциплины «Базы данных»
и подготовит их к
проведению собственных
научных исследований, а также выполнению курсовых и дипломных
работ.
З
адачи
научно
-
исследовательского семинара
:
В результате
участия в семинаре
студенты
могут приобрести следующие
компетенции
:
по общей методологии научного
исследования
:
овладеть базовыми умениями и навыками ведения самостоятельных
исследований на примере управления данными и знаниями
;
получить навыки выступлений с научными докладами, оформления
содержательных презентаций и научиться корректно вести научные
д
искуссии
;
по тематике научного семинара
:
иметь представление о современном состоянии и тенденциях
развития систем управления базами данных
и знаний
;
получить углубленные знания в области методов организации
хранения, индексирования и поиска
данных;
получ
ить знания о современных классах систем управления базами
данных
;
получить знания о современных распределенных системах хранения
данных высокой доступности и массовой праллельной обработки
данных
;
ознакомиться с методами управления знаниями, моделями
предс
тавления знаний и организацией механизмов логического
вывода
;
приобрести знания о методах машинного обучения
;
получить представление о моделях, методах и средствах, лежащих в
основе семантического веба
.
II
.
Содержание семинара
Участникам семинара
предлагаются для обсуждения и последующего
исследования следующие крупные тем, каждая из которых допускает
достаточно широкую детализацию и богатый выбор конкретных примеров и
задач.
1.
Методы индексирования данных
.
B
-
Tree
,
Bitmap
,
Hash
.
2.
Пространственные баз
ы данных.
Пространственные индексы.
3.
Темпоральные базы данных
.
T
-
SQL
2.
4
4.
Системы управления потоками данных
.
TelegraphCQ
,
Borealis
,
STREAM
.
5.
Распределенные транзакционные базы данных
.
Двухфазная фиксация
транзакций 2
PC
.
6.
Распределенные базы данных высокой
доступности. Теорема
CAP
.
DHT.
Google BigTable, Dynamo
, Cassandra
.
7.
Документо
-
ориентированные базы данных
.
CouchDB
,
MongoDB
,
Redis
.
8.
Системы обработки данных
Map
-
Reduce
.
Hadoop, HBase.
9.
Модели представления знаний и механизмы вывода
.
Логические модели,
продукции, семантические сети, фреймы.
10.
Методы машинного обучения
. Нейронные сети. Эволюционные
алгоритмы. Нечеткая логика.
11.
Семантический веб.
Средства описания онтологий
.
Ι
II
.
Рекомендуемая литература
1.
Кузнецов С.Д. Базы данных. Модели и языки.
—
М.:Бином
-
Пресс, 2008.
—
720с.
2.
Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и
сопровождение. Теория и практика 3
-
е изд.
—
М.: Вильямс, 2003.
—
1436с.
3.
Крёнке
Д. Теория и практика построения баз данных. 9
-
е изд.
—
СПб.:Питер,
2005.
—
864с.
4.
Пирогов В.Ю. Информационные системы и базы данных: организация и
проектирование.
—
СПб.:БХВ
-
Петербург, 2009.
—
528с.
5.
Шекхар Ш., Чаула
С. Основы пространственных баз данных.
—
М.:КУДИЦ
-
Образ, 2004.
—
336с.
6.
Когаловский М.Р. Энциклопедия технологий баз данных. Эволюция
технологий, технологии и стандарты, инфраструктура, терминология.
–
М.:
Финансы и статистика, 2003.
-
800с.
7.
Рассел
C
., Норвиг
П.
Искусственный интеллект: современный подход
.
—
М.:Вильямс, 2006.
–
1408с.
8.
Осипов Г.С. Лекции по искусственному интеллекту
—
М.: УРСС, 2009.
—
272 с.
9.
Рыбина Г.В. Основы построения интеллектуальных систем
.
—
М.: Финансы
и статистика, 2009.
—
432 c.
10.
Кома
рцова Л.Г., Максимов А.В. Нейрокомпьютеры. 2
-
е изд.
—
М.: МГТУ
им. Н.Э.Баумана, 2006.
—
400 с.
11.
Яхъяева Г.Э. Нечеткие множества и нейронные сети: учебное пособие для
вузов.
—
М.:Интернет
-
университет информационных технологий
–
ИНТУИТ.ру, 2006.
—
320 с.
12.
Рутк
овская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические
алгоритмы и нечеткие системы.
—
М.:Горячая Линия
-
Телеком, 2006.
—
452с.
13.
Усков А.А., Кузьмин А.В. Интеллектуальные технологии управления.
Искусственные нейронные сети и нечеткая логика.
—
М.: Горячая Линия
-
Телеком, 2004.
—
144 с.
5
14.
Hoffer, Jeffrey A., Prescott, Mary B, McFadden, Fred R. (2007), Modern Database
Management. 8
th
ed.
—
Upper Saddle River, New Jersey: Pearson
Education Inc
.
15.
Ramakrishnan, Raghu, Gehrke, Johannes (2002), Databas
e Management Systems.
3
rd
ed.
—
New York: McGraw
-
Hill.
16.
Celko, Joe (1999),
Joe Celko's Data and Databases: Concepts in Practice
.
—
San
Francisco:
Morgan Kaufmann Publishers.
17.
Hay, David C. (1996), Data Model Patterns. Conventions of Thought.
—
New
York:
Dorset House Publishing.
18.
Davies,
John,
Fensel,
van Harmelen,
Frank (2003),
Towards the Semantic
Web: Ontology
-
Driven Knowledge Management
.
—
John Wiley & Sons
19.
Allemang, Dean, Hendler, James (2008), Semantic Web for the Working
Ontologist: Effecti
ve Modelling in RDFS and OWL.
—
Morgan Kafmann.
—
352
pp.
20.
Центр
информационных
технологий
“
ЦИТ
Форум
”.
Базы
данных
.
http
://
www
.
citforum
.
ru
/
database
21.
TimeCenter
–
international center for the support of temporal
database applications
http://timecenter.cs.aau.dk/
22.
TelegraphCQ
http://telegraph.cs.berkeley.edu/telegraphcq/v0.2/
23.
Borealis
.
Distributed
Stream
Processing
Engine
http://www.cs.brown.edu/research/borealis/public/
24.
Stanford STREAM Data Manager
http://infolab.stanford.edu/stream/
25.
Browne J.
Brewer’s CAP Theorem
http://www.julianbrowne.com/article/viewer/brewers
-
cap
-
theorem
26.
Chord: A Scalable Peer
-
to
-
peer Lookup Service for Internet Applications
http://pdos.csail.mit.edu/papers/chord:sigcomm01/
27.
Bigtable: A Distributed Storage System for Structured Data
http://labs.google.com/papers/bigtable.html
28.
Apache Cassandra
http://cassangdra.apache.org
29.
Dynamo: Amazon’s Highly Available Key
-
value Store
http://www.allthingsdistributed.co
m/files/amazon
-
dynamo
-
sosp2007.pdf
30.
CouchDB
http://couchdb.apache.org
31.
MongoDB
http://www.mongodb.org
32.
Redis
http://redis.io
33.
Riak
http://wiki.basho.com/
34.
Dean J., Ghemawat S.
MapReduce: Simplified Data Processing on Large Clusters
http://labs.google.com/papers/mapreduce.html
35.
Apache Hadoop
http://hadoop.apache.orgh
36.
HBase
http://hbase.apache.org
37.
Sowa, John F. Semantic Networks
38.
OWL Web Ontology
Language Reference
http://www.w3.org/TR/owl
-
ref/
39.
The Rule Markup Initiative
http://ruleml.org/
40.
Description Logics
http://dl.kr.org
6
V
. Формы контро
ля
Текущий контроль:
учет посещаемости семинара и оценка
качества подготовки
и активности
(доклады, презентации, оппонирование, критические выступления
,
решение задач и реализация компьютерных программ
).
При непосещении
занятий ставится оценка «0».
Рубежный
контроль:
зачет в конце 4 модуля в форме научной конференции
—
доклады участников семинара о проведенных исследованиях с презентацией
полученных результатов. Дополнительно учитываются выступления на научных
конференциях и публикации в журналах и с
борниках научных трудов.
Перевод в пятибалльную оценку осуществляется в соответствии со
следующей таблицей
:
Таблица соответствия оценок по десятибалльной и пятибалльной шкалам
По десятибалльной шкале
По пятибалльной шкале
1
–
неудовлетворительно
2
–
очень плохо
3
–
плохо
2
–
неудовлетворительно
4
–
удовлетворительно
5
–
весьма удовлетворительно
3
–
удовлетворительно
6
–
хорошо
7
–
очень хорошо
4
–
хорошо
8
–
почти отлично
9
–
отлично
10
–
блестяще
5
–
отлично
Автор программы
:
_________________________ Брейман А.Д.