Александр Дьяконов (Москва, МГУ). Решение победителя (Chenglong Chen). https://github.com/ChenglongChen/Kaggle_CrowdFlower.


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.




Р
Р
л
л
ш
ш
л
л
н
н
о
о
л
л


н
н
а
а
к
к
а
а
ч
ч
о
о


S
S
e
e
a
a
r
r
c
c
h
h


R
R
e
e
s
s
u
u
l
l
t
t
s
s


R
R
e
e
l
l
e
e
v
v
a
a
n
n
c
c
e
e




А
А
с
с
л
л
р
р
ч
ч
а
а
н
н
к
к
р
р


Д
Д
ь
ь
я
я
р
р
о
о
н
н
о
о
и
и




М
М
о
о
ч
ч
р
р
о
о
и
и
ч
ч
р
р
о
о
й
й


й
й
о
о
ч
ч
у
у
к
к
а
а
р
р
ч
ч
т
т
и
и
л
л
н
н
н
н
ы
ы
й
й


у
у
н
н
о
о
и
и
л
л
р
р
ч
ч
о
о
т
т
л
л
т
т


о
о
м
м
л
л
н
н
о
о


М
М
.
.
В
В
.
.


Л
Л
о
о
м
м
о
о
н
н
о
о
ч
ч
о
о
и
и
а
а


(
(
М
М
о
о
ч
ч
р
р
и
и
а
а
,
,


Р
Р
о
о
ч
ч
ч
ч
о
о
я
я
)
)



Разбор задачи с
www
.
kaggle
.
com

2

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года






Закача Search Results Relevance


П
П
о
о
х
х
о
о
м
м
а
а


н
н
а
а


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ч
ч
л
л
ч
ч
р
р
у
у
ю
ю


н
н
а
а
к
к
а
а
ч
ч
у
у


п
п
о
о
о
о
ч
ч
р
р
а
а


r
r
o
o
w
w


i
i
d
d


q
q
u
u
e
e
r
r
y
y


p
p
r
r
o
o
d
d
u
u
c
c
t
t
_
_
t
t
i
i
t
t
l
l
e
e


p
p
r
r
o
o
d
d
u
u
c
c
t
t
_
_
d
d
e
e
s
s
c
c
r
r
i
i
p
p
t
t
i
i
o
o
n
n


m
m
e
e
d
d
i
i
a
a
n
n


r
r
e
e
l
l
e
e
v
v
a
a
n
n
c
c
e
e


r
r
e
e
l
l
e
e
v
v
a
a
n
n
c
c
e
e


v
v
a
a
r
r
i
i
a
a
n
n
c
c
e
e


78

230

harleydavidson

Harley
-
Davidson and Philosophy
(Paperback)



4

0.943

120

367

nin
ja turtle socks

Highpoint Kids' 5PK No Show
(Assorted)

He will feel like a
superhero in the Teenage
Mutant Ninja Turtles 5PK
No Show Socks by
Highpoint.

4

0.800

6076

19557

long prom dress

Daniella Collection

This one piece dress has
mesh and rhinestone
de
tailing. This dress
features long sleeves, a
round neckline and a
flared hem.

3

0.866

153

472

16 gb memory card

Sandisk 16GB non
-
HS MSD Flash Drive
3in1
-

Black (SDSDQR
-
016G
-
T46A)

SanDisk Elevate 16GB non
-
HS MSD 3in, microSD memory
card with USB adapter a
nd
SD adapter. Includes
RescuePro recovery
software.

Memory Storage Capacity:
16GB

Wired Connectivity: Micro
SD Slot

Features: Plug and Play

Includes: MicroSD Adapter,
Adapter, USB Adapter

Battery no battery used

4

0.000

Разбор задачи с
www
.
kaggle
.
com

3

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Закача


Д
Д
а
а
н
н


н
н
а
а
п
п
р
р
о
о
ч
ч
:
:


1
1
6
6


g
g
b
b


m
m
e
e
m
m
o
o
r
r
y
y


c
c
a
a
r
r
d
d


Ему чоотилтчтиулт
и
и
ы
ы
к
к
а
а
ч
ч
а
а
.

гслмлнт иыкачо



(нанианол тоиара, опочанол)

S
S
a
a
n
n
d
d
i
i
s
s
k
k


1
1
6
6
G
G
B
B


n
n
o
o
n
n
-
-
H
H
S
S


M
M
S
S
D
D


F
F
l
l
a
a
s
s
h
h


D
D
r
r
i
i
v
v
e
e


3
3
i
i
n
n
1
1


-
-


B
B
l
l
a
a
c
c
k
k


(
(
S
S
D
D
S
S
D
D
Q
Q
R
R
-
-
0
0
1
1
6
6
G
G
-
-
T
T
4
4
6
6
A
A
)
)


S
S
a
a
n
n
D
D
i
i
s
s
k
k


E
E
l
l
e
e
v
v
a
a
t
t
e
e


1
1
6
6
G
G
B
B


n
n
o
o
n
n
-
-
H
H
S
S


M
M
S
S
D
D


3
3
i
i
n
n
,
,


m
m
i
i
c
c
r
r
o
o
S
S
D
D


m
m
e
e
m
m
o
o
r
r
y
y


c
c
a
a
r
r
d
d


w
w
i
i
t
t
h
h


U
U
S
S
B
B


a
a
d
d
a
a
p
p
t
t
e
e
r
r


a
a
n
n
d
d


S
S
D
D


a
a
d
d
a
a
p
p
t
t
e
e
r
r
.
.


I
I
n
n
c
c
l
l
u
u
d
d
e
e
s
s


R
R
e
e
s
s
c
c
u
u
e
e
P
P
r
r
o
o


r
r
e
e
c
c
o
o
v
v
e
e
r
r
y
y


s
s
o
o
f
f
t
t
w
w
a
a
r
r
e
e
.
.


M
M
e
e
m
m
o
o
r
r
y
y


S
S
t
t
o
o
r
r
a
a
g
g
e
e


C
C
a
a
p
p
a
a
c
c
i
i
t
t
y
y
:
:


1
1
6
6
G
G
B
B


W
W
i
i
r
r
e
e
d
d


C
C
o
o
n
n
n
n
e
e
c
c
t
t
i
i
v
v
i
i
t
t
y
y
:
:


M
M
i
i
c
c
r
r
o
o


S
S
D
D


S
S
l
l
o
o
t
t


F
F
e
e
a
a
t
t
u
u
r
r
e
e
s
s
:
:


P
P
l
l
u
u
g
g


a
a
n
n
d
d


P
P
l
l
a
a
y
y


I
I
n
n
c
c
l
l
u
u
d
d
e
e
s
s
:
:


M
M
i
i
c
c
r
r
o
o
S
S
D
D


A
A
d
d
a
a
p
p
t
t
e
e
r
r
,
,


A
A
d
d
a
a
p
p
t
t
e
e
r
r
,
,


U
U
S
S
B
B


A
A
d
d
a
a
p
p
t
t
e
e
r
r


B
B
a
a
t
t
t
t
e
e
r
r
y
y


n
n
o
o


b
b
a
a
t
t
t
t
e
e
r
r
y
y


u
u
s
s
e
e
d
d



Парл (напроч, иыкача) чоотилтчтиулт
рлслиантночть



1,

2,

3 осо 4.


Дана ляё
кочплрчоя рлслиантночтлй (т.р. нлчросьро
аччлчорои

оьлноиасо иыкачу), но нл зыса очпосьноиана.


Запомном:
рлслиантночть и озучлноо


млкоана

рлслиантночтлй,
роторыл прочтаиосо аччлчоры

Разбор задачи с
www
.
kaggle
.
com

4

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Закача


П
П
о
о
ч
ч
л
л
м
м
у
у


н
н
л
л


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ч
ч
л
л
ч
ч
р
р
а
а
я
я


н
н
а
а
к
к
а
а
ч
ч
а
а


п
п
о
о
о
о
ч
ч
р
р
а
а
?
?








З
З
а
а
п
п
р
р
о
о
ч
ч
ы
ы


и
и


т
т
л
л
ч
ч
т
т
л
л


т
т
а
а
р
р
о
о
л
л


м
м
л
л


р
р
а
а
р
р


о
о


и
и


о
о
з
з
у
у
ч
ч
л
л
н
н
о
о
о
о
!
!




г
г
т
т
о
о


м
м
о
о
м
м
н
н
о
о


о
о
ч
ч
п
п
о
о
с
с
ь
ь
н
н
о
о
и
и
а
а
т
т
ь
ь
!
!


Разбор задачи с
www
.
kaggle
.
com

5

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Закача





Х
Х
о
о
р
р
о
о
ш
ш
а
а
я
я


и
и
ы
ы
к
к
а
а
ч
ч
а
а


(
(
к
к
с
с
я
я


о
о
п
п
р
р
л
л
к
к
л
л
с
с
ё
ё
н
н
н
н
о
о
й
й
о
о


н
н
а
а
п
п
р
р
о
о
ч
ч
а
а
)
)


к
к
о
о
с
с
м
м
н
н
а
а


з
з
ы
ы
т
т
ь
ь


п
п
о
о
х
х
о
о
м
м
а
а


н
н
а
а


х
х
о
о
р
р
о
о
ш
ш
о
о
л
л


и
и
ы
ы
к
к
а
а
ч
ч
о
о


(
(
э
э
т
т
о
о
й
й
о
о


н
н
а
а
п
п
р
р
о
о
ч
ч
а
а
)
)
!
!


Разбор задачи с
www
.
kaggle
.
com

6

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Фунрьоонас рачлчтиа:
Quadratic

Weighted

Kappa


пораныиалт чойсачоианночть порякрои,

ройка отилты "
млра рлслиантночто"



y

= 1 1 1 2 2 3 3 3
# правильный ответ

a

= 1 1 2 1 3 2 3 3
# наш ответ


0.6666667


a

= 1 1 1 2 2 3 3 3
# наш ответ


1


a

= 3 3 3 2 2 1 1 1
# наш ответ



1


Разбор задачи с
www
.
kaggle
.
com

7

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Quadratic Weighted Kappa


E
=

table
(
y
)

%*%

t
(
table
(
a
))


O
=

table
(
y,a
)



E
=

E
/
sum
(
E
)*
sum
(
O
)


n
=

length
(
unique
(
y
))


W
=

(
matrix
(
1
:
n,nr
=
n,nc
=
n
)

-

matrix
(
1
:
n,nr
=
n,nc
=
n,byrow
=

TRUE
))**
2
/(
n
-
1
)**
2


kappa

=

1
-
sum
(
W
*
O
)/
sum
(
W
*
E
)


a = 1 1 2 1 3 2 3 3

y = 1 1 1 2 2 3 3 3


O =


a

y 1 2 3


1 2 1 0


2 1 0 1


3 0 1 2

W =


[,1] [,2] [,3]

[1,] 0.00 0.25 1.00

[2,] 0.25 0.00 0.25

[3,] 1.00 0.25 0.00

E

=


a

y

1 2 3


1 9 6 9


2 6 4 6


3 9 6 9

E

=

нормализованная


a

y 1 2 3


1 1.125 0.75 1.125


2 0.750 0.50 0.750


3 1.125 0.75 1.125


Kappa

=

0.6666667



Разбор задачи с
www
.
kaggle
.
com

8

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Млток рлшлноя




1
1
.
.


П
П
р
р
л
л
к
к
о
о
з
з
р
р
а
а
з
з
о
о
т
т
р
р
а
а


к
к
а
а
н
н
н
н
ы
ы
х
х


2
2
.
.


Г
Г
л
л
н
н
л
л
р
р
а
а
ь
ь
о
о
я
я


п
п
р
р
о
о
н
н
н
н
а
а
р
р
о
о
и
и


3
3
.
.


В
В
ы
ы
з
з
о
о
р
р


м
м
о
о
к
к
л
л
с
с
о
о


/
/


н
н
а
а
ч
ч
т
т
р
р
о
о
й
й
р
р
а
а


4
4
.
.


А
А
н
н
ч
ч
а
а
м
м
з
з
с
с
о
о


5
5
.
.


Д
Д
л
л
ф
ф
о
о
р
р
м
м
а
а
ь
ь
о
о
я
я


о
о
т
т
и
и
л
л
т
т
о
о
и
и


/
/


р
р
л
л
ш
ш
а
а
ю
ю
я
я
л
л
л
л


п
п
р
р
а
а
и
и
о
о
с
с
о
о


Разбор задачи с
www
.
kaggle
.
com

9

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почтролнол очлнь прочтой моклсо!


S
S
a
a
n
n
d
d
i
i
s
s
k
k


1
1
6
6
G
G
B
B


n
n
o
o
n
n
-
-
H
H
S
S


M
M
S
S
D
D


F
F
l
l
a
a
s
s
h
h


D
D
r
r
i
i
v
v
e
e


3
3
i
i
n
n
1
1


-
-


B
B
l
l
a
a
c
c
k
k


(
(
S
S
D
D
S
S
D
D
Q
Q
R
R
-
-
0
0
1
1
6
6
G
G
-
-
T
T
4
4
6
6
A
A
)
)


У
У
к
к
а
а
с
с
я
я
л
л
м
м


h
h
t
t
m
m
l
l
-
-
т
т
л
л
й
й
о
о
,
,


ч
ч
х
х
с
с
о
о
п
п
ы
ы
и
и
а
а
л
л
м
м


т
т
л
л
р
р
ч
ч
т
т
,
,


у
у
к
к
а
а
с
с
я
я
л
л
м
м


ч
ч
п
п
л
л
ь
ь
ч
ч
о
о
м
м
и
и
о
о
с
с
ы
ы




s
s
a
a
n
n
d
d
i
i
s
s
k
k
1
1
6
6
g
g
b
b
n
n
o
o
n
n
h
h
s
s
m
m
s
s
d
d
f
f
l
l
a
a
s
s
h
h
d
d
r
r
i
i
v
v
e
e
3
3
i
i
n
n
1
1


b
b
l
l
a
a
c
c
k
k
s
s
d
d
s
s
d
d
q
q
r
r
0
0
1
1
6
6
g
g
t
t
4
4
6
6
a
a


Д
Д
л
л
с
с
а
а
л
л
м
м


3
3
-
-
й
й
р
р
а
а
м
м
м
м
ы
ы




s
s
a
a
n
n
,
,
a
a
n
n
d
d
,
,
n
n
d
d
i
i
,
,
d
d
i
i
s
s
,
,
i
i
s
s
k
k
,
,
s
s
k
k
1
1
,
,
k
k
1
1
6
6
,
,
1
1
6
6
g
g
,
,


6
6
g
g
b
b
,
,
g
g
b
b
n
n


.
.
.
.
.
.




Р
Р
ч
ч
т
т
а
а
т
т
о
о
,
,


к
к
с
с
я
я


п
п
р
р
а
а
и
и
о
о
с
с
ь
ь
н
н
о
о
й
й
о
о


ч
ч
с
с
о
о
и
и
а
а


"
"
s
s
c
c
a
a
n
n
d
d
i
i
s
s
k
k
"
"
:
:


s
s
c
c
a
a
,
,


c
c
a
a
n
n
,
,


a
a
n
n
d
d
,
,


n
n
d
d
i
i
,
,


d
d
i
i
s
s
,
,


i
i
s
s
k
k


П
П
л
л
р
р
л
л
х
х
о
о
к
к
о
о
м
м


р
р


м
м
о
о
к
к
л
л
с
с
о
о


"
"
м
м
л
л
ш
ш
о
о
р
р


ч
ч
с
с
о
о
и
и
"
"


+
+


t
t
f
f
-
-
i
i
d
d
f
f








3
3
-
-
й
й
р
р
а
а
м
м
м
м
ы
ы


м
м
о
о
й
й
у
у
т
т


п
п
о
о
з
з
л
л
к
к
о
о
т
т
ь
ь


о
о
п
п
л
л
ч
ч
а
а
т
т
р
р
о
о
.
.


Разбор задачи с
www
.
kaggle
.
com

10

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Друйол покхокы (2л млчто)




h
h
a
a
r
r
d
d
i
i
s
s
k
k


h
h
a
a
r
r
d
d


d
d
r
r
i
i
v
v
e
e


e
e
x
x
t
t
e
e
n
n
a
a
l
l


e
e
x
x
t
t
e
e
r
r
n
n
a
a
l
l


s
s
o
o
d
d
a
a


s
s
t
t
r
r
e
e
a
a
m
m


s
s
o
o
d
d
a
a
s
s
t
t
r
r
e
e
a
a
m
m


f
f
r
r
a
a
g
g
a
a
n
n
c
c
e
e


f
f
r
r
a
a
g
g
r
r
a
a
n
n
c
c
e
e


1
1
6
6


g
g
b
b


1
1
6
6
g
g
b
b


3
3
2
2


g
g
b
b


3
3
2
2
g
g
b
b


5
5
0
0
0
0


g
g
b
b


5
5
0
0
0
0
g
g
b
b


2
2


t
t
b
b


2
2
t
t
b
b


s
s
h
h
o
o
p
p
p
p
e
e


s
s
h
h
o
o
p
p


r
r
e
e
f
f
r
r
i
i
g
g
i
i
r
r
a
a
t
t
o
o
r
r


r
r
e
e
f
f
r
r
i
i
g
g
e
e
r
r
a
a
t
t
o
o
r
r


a
a
s
s
s
s
a
a
s
s
s
s
i
i
n
n
s
s
s
s


a
a
s
s
s
s
a
a
s
s
s
s
i
i
n
n
s
s


h
h
a
a
r
r
l
l
e
e
y
y
d
d
a
a
v
v
i
i
d
d
s
s
o
o
n
n


h
h
a
a
r
r
l
l
e
e
y
y


d
d
a
a
v
v
i
i
d
d
s
s
o
o
n
n


h
h
a
a
r
r
l
l
e
e
y
y
-
-
d
d
a
a
v
v
i
i
d
d
s
s
o
o
n
n


h
h
a
a
r
r
l
l
e
e
y
y


d
d
a
a
v
v
i
i
d
d
s
s
o
o
n
n


У
У
а
а


п
п
р
р
а
а
р
р
т
т
о
о
р
р
л
л


т
т
а
а
р
р


т
т
о
о
м
м
л
л


к
к
л
л
с
с
а
а
ю
ю
т
т






м
м
н
н
о
о
й
й
о
о


р
р
у
у
ч
ч
н
н
о
о
й
й


р
р
а
а
н
н
м
м
л
л
т
т
р
р
о
о
.
.




З
З
к
к
л
л
ч
ч
ь
ь


к
к
с
с
я
я


п
п
р
р
о
о
ч
ч
т
т
о
о
т
т
ы
ы


м
м
о
о
к
к
л
л
с
с
о
о


н
н
л
л


ч
ч
т
т
а
а
с
с
о
о




З
З
а
а
м
м
л
л
т
т
о
о
м
м
,
,


ч
ч
т
т
о
о


м
м
о
о
к
к
л
л
с
с
ь
ь


ч
ч
т
т
а
а
н
н
о
о
и
и
о
о
т
т
ч
ч
я
я


п
п
л
л
р
р
л
л
о
о
з
з
у
у
ч
ч
л
л
н
н
н
н
о
о
й
й
.
.


Д
Д
с
с
я
я


н
н
о
о
и
и
ы
ы
х
х


н
н
а
а
п
п
р
р
о
о
ч
ч
о
о
и
и


т
т
а
а
р
р
о
о
й
й
о
о


р
р
у
у
ч
ч
н
н
о
о
й
й
о
о


у
у
ч
ч
т
т
р
р
а
а
н
н
л
л
н
н
о
о
я
я


н
н
л
л
о
о
к
к
н
н
о
о
н
н
н
н
а
а
ч
ч
н
н
о
о
ч
ч
т
т
л
л
й
й


н
н
л
л
т
т
!
!


Разбор задачи с
www
.
kaggle
.
com

11

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Друйол покхокы (
1
л млчто)




З
З
к
к
л
л
ч
ч
ь
ь


ч
ч
о
о
н
н
к
к
а
а
н
н


ч
ч
с
с
о
о
и
и
а
а
р
р
ь
ь


ч
ч
о
о
н
н
о
о
н
н
о
о
м
м
о
о
и
и




c
c
h
h
i
i
l
l
d
d
,
,


k
k
i
i
d
d


k
k
i
i
d
d


b
b
i
i
c
c
y
y
c
c
l
l
e
e
,
,


b
b
i
i
k
k
e
e


b
b
i
i
k
k
e
e


r
r
e
e
f
f
r
r
i
i
g
g
e
e
r
r
a
a
t
t
o
o
r
r
,
,


f
f
r
r
i
i
d
d
g
g
e
e
,
,


f
f
r
r
e
e
e
e
z
z
e
e
r
r


f
f
r
r
i
i
d
d
g
g
e
e


f
f
r
r
a
a
g
g
r
r
a
a
n
n
c
c
e
e
,
,


p
p
e
e
r
r
f
f
u
u
m
m
e
e
,
,


c
c
o
o
l
l
o
o
g
g
n
n
e
e
,
,


e
e
a
a
u
u


d
d
e
e


t
t
o
o
i
i
l
l
e
e
t
t
t
t
e
e


p
p
e
e
r
r
f
f
u
u
m
m
e
e




В
В
ч
ч
л
л


к
к
л
л
с
с
а
а
с
с
о
о


ч
ч
т
т
л
л
м
м
м
м
о
о
н
н
й
й


(
(
м
м
ы
ы


н
н
л
л
т
т
)
)
.
.


Разбор задачи с
www
.
kaggle
.
com

12

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Проннаро


У
У
а
а
ч
ч
р
р
о
о
с
с
ь
ь
р
р
о
о


п
п
о
о
х
х
о
о
м
м
о
о


т
т
л
л
р
р
ч
ч
т
т
ы
ы
?
?




Т
Т
о
о
ч
ч
н
н
л
л
л
л
:
:


м
м
н
н
о
о
м
м
л
л
ч
ч
т
т
и
и
а
а


s
s
a
a
n
n
,
,
a
a
n
n
d
d
,
,
n
n
d
d
i
i
,
,
d
d
i
i
s
s
,
,
i
i
s
s
k
k
,
,
s
s
k
k
1
1
,
,
k
k
1
1
6
6
,
,
1
1
6
6
g
g
,
,


6
6
g
g
b
b
,
,
g
g
b
b
n
n


.
.
.
.
.
.


s
s
c
c
a
a
,
,


c
c
a
a
n
n
,
,


a
a
n
n
d
d
,
,


n
n
d
d
i
i
,
,


d
d
i
i
s
s
,
,


i
i
s
s
k
k






c
c
o
o
s
s
-
-
м
м
л
л
р
р
а
а
,
,


м
м
о
о
я
я
н
н
о
о
ч
ч
т
т
ь
ь


п
п
л
л
р
р
л
л
ч
ч
л
л
ч
ч
л
л
н
н
о
о
я
я


(
(
н
н
о
о
р
р
м
м
о
о
р
р
о
о
и
и
а
а
н
н
н
н
а
а
я
я
)
)




Разбор задачи с
www
.
kaggle
.
com

13

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Проннаро


cos
(
опочанол, напроч
)


cos
(
опочанол, напроч
)

норморулм на

max
(
опочанол, напроч
)

по ичлм опочаноям этойо напроча


mean
(
cos
(опочанол, опочанол ичлх тоиарои этойо напроча и
озучлноо: оьлнра =
4
))


оьлнра тоиара: на нём
max

cos
(опочанол, лйо опочанол)


опочанол =



чамо опочанол



найосоиор



найосоиор + опочанол

Разбор задачи с
www
.
kaggle
.
com

14

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Проннаро




это инаомоклйчтиоя зсорои канных!




Разбор задачи с
www
.
kaggle
.
com

15

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Вызор моклсо






И
И
н
н
н
н
а
а
ч
ч
а
а
с
с
ь
ь
н
н
о
о


п
п
р
р
о
о
з
з
с
с
л
л
м
м
а
а


р
р
а
а
р
р


н
н
а
а
ч
ч
т
т
р
р
а
а
о
о
и
и
а
а
т
т
ь
ь
ч
ч
я
я
:
:




1
1
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ф
ф
о
о
р
р
а
а
ь
ь
о
о
о
о


ч
ч


р
р
с
с
а
а
ч
ч
ч
ч
а
а
м
м
о
о


[
[
1
1
,
,


2
2
,
,


3
3
,
,


4
4
]
]




2
2
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
1
1
,
,


2
2
,
,


3
3
,
,


4
4
]
]




3
3
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
1
1
,
,


4
4
,
,


9
9
,
,


1
1
6
6
]
]




4
4
.
.


З
З
а
а
к
к
а
а
ч
ч
о
о


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ф
ф
о
о
р
р
а
а
ь
ь
о
о
о
о
/
/
р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
0
0
,
,


1
1
,
,


1
1
,
,


1
1
]
]


[
[
0
0
,
,


0
0
,
,


1
1
,
,


1
1
]
]


[
[
0
0
,
,


0
0
,
,


0
0
,
,


1
1
]
]




Разбор задачи с
www
.
kaggle
.
com

16

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Вызор моклсо




И
И
н
н
н
н
а
а
ч
ч
а
а
с
с
ь
ь
н
н
о
о


п
п
р
р
о
о
з
з
с
с
л
л
м
м
а
а


р
р
а
а
р
р


н
н
а
а
ч
ч
т
т
р
р
а
а
о
о
и
и
а
а
т
т
ь
ь
ч
ч
я
я
:
:




1
1
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ф
ф
о
о
р
р
а
а
ь
ь
о
о
о
о


ч
ч


р
р
с
с
а
а
ч
ч
ч
ч
а
а
м
м
о
о


[
[
1
1
,
,


2
2
,
,


3
3
,
,


4
4
]
]


п
п
с
с
о
о
х
х
о
о






н
н
л
л
т
т


у
у
ч
ч
ё
ё
т
т
а
а


п
п
о
о
р
р
я
я
к
к
р
р
а
а


2
2
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
1
1
,
,


2
2
,
,


3
3
,
,


4
4
]
]


х
х
о
о
р
р
о
о
ш
ш
о
о


3
3
.
.


З
З
а
а
к
к
а
а
ч
ч
а
а


р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
1
1
,
,


4
4
,
,


9
9
,
,


1
1
6
6
]
]


н
н
у
у
м
м
н
н
ы
ы


э
э
р
р
ч
ч
п
п
л
л
р
р
о
о
м
м
л
л
н
н
т
т
ы
ы


4
4
.
.


З
З
а
а
к
к
а
а
ч
ч
о
о


р
р
с
с
а
а
ч
ч
ч
ч
о
о
ф
ф
о
о
р
р
а
а
ь
ь
о
о
о
о
/
/
р
р
л
л
й
й
р
р
л
л
ч
ч
ч
ч
о
о
о
о


ч
ч


м
м
л
л
т
т
р
р
а
а
м
м
о
о


[
[
0
0
,
,


1
1
,
,


1
1
,
,


1
1
]
]


[
[
0
0
,
,


0
0
,
,


1
1
,
,


1
1
]
]


[
[
0
0
,
,


0
0
,
,


0
0
,
,


1
1
]
]


Р
Р
а
а
р
р


п
п
о
о
т
т
о
о
м
м


о
о
ч
ч
п
п
о
о
с
с
ь
ь
н
н
о
о
и
и
а
а
т
т
ь
ь


о
о
т
т
и
и
л
л
т
т
ы
ы
?
?


Разбор задачи с
www
.
kaggle
.
com

17

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Уачтройра моклсо






model

-

randomForest
(
M1, mr, mtry
=
40
, ntree
=
200
, nodesize
=
10
)

a

-

predict
(
model, M2
)

b
=

pmin
(
pmax
(
round
(
1.45
*(
a
-
3.309805
)+
3.309805
)
,
1
)
,
4
)


И
И
ч
ч
п
п
о
о
с
с
ь
ь
н
н
о
о
и
и
а
а
с
с
о
о
ч
ч
ь
ь


ч
ч
с
с
у
у
ч
ч
а
а
й
й
н
н
ы
ы
л
л


с
с
л
л
ч
ч
а
а


(
(
к
к
а
а
м
м
л
л


н
н
л
л


з
з
ы
ы
с
с
о
о


н
н
а
а
и
и
о
о
ч
ч
о
о
м
м
о
о
ч
ч
т
т
о
о


о
о
т
т


п
п
а
а
р
р
а
а
м
м
л
л
т
т
р
р
о
о
и
и
!
!
)
)


Разбор задачи с
www
.
kaggle
.
com

18

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Отсакра




k
k
-
-
f
f
o
o
l
l
d
d








Разбор задачи с
www
.
kaggle
.
com

19

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Отилты асйоротма




П
П
о
о
ч
ч
л
л
м
м
у
у


м
м
л
л
к
к
о
о
а
а
н
н
а
а


р
р
а
а
н
н
н
н
ы
ы
х
х


а
а
с
с
й
й
о
о
р
р
о
о
т
т
м
м
о
о
и
и


с
с
у
у
ч
ч
ш
ш
л
л


у
у
ч
ч
р
р
л
л
к
к
н
н
л
л
н
н
о
о
я
я
?
?
!
!


Разбор задачи с
www
.
kaggle
.
com

20

слайд из
2
8

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почлму нумны клформаьоо








hist
(
train
[
,
1
]
, probability
=
TRUE
,
col
=
'light blue'
)

points
(
density
(
a
)
, type
=
'l'
, lwd
=
2
,
col
=
'red'
)

Разбор задачи с
www
.
kaggle
.
com

21

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почлму нумны клформаь
оо







Е
Е
ч
ч
с
с
о
о


п
п
р
р
о
о
ч
ч
т
т
о
о


о
о
р
р
р
р
у
у
й
й
с
с
о
о
т
т
ь
ь






п
п
л
л
р
р
л
л
р
р
о
о
ч
ч


и
и


р
р
а
а
ч
ч
п
п
р
р
л
л
к
к
л
л
с
с
л
л
н
н
о
о
я
я
х
х





hist
(
round
(
a
)
, probability
=
TRUE
,
col
=
'pink'
)



Разбор задачи с
www
.
kaggle
.
com

22

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почлму нумны клформаьоо







С
С
п
п
л
л
ь
ь
о
о
а
а
с
с
ь
ь
н
н
а
а
я
я


к
к
л
л
ф
ф
о
о
р
р
м
м
а
а
ь
ь
о
о
я
я






р
р
а
а
ч
ч
п
п
р
р
л
л
к
к
л
л
с
с
л
л
н
н
о
о
я
я


и
и
ы
ы
р
р
а
а
и
и
н
н
о
о
и
и
а
а
ю
ю
т
т
ч
ч
я
я




hist
(
pmin
(
pmax
(
round
(
1.45
*(
a
-
3.309805
)+
3.309805
)
,
1
)
,
4
)
,
probability
=
TRUE
,
col
=
'
green
'
)
Разбор задачи с
www
.
kaggle
.
com

23

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почлму

нумны

клформаьоо







В
В


п
п
р
р
о
о
н
н
ь
ь
о
о
п
п
л
л
,
,


м
м
о
о
м
м
н
н
о
о


п
п
р
р
о
о
ч
ч
т
т
о
о


и
и
ы
ы
з
з
о
о
р
р
а
а
т
т
ь
ь


п
п
о
о
р
р
о
о
й
й
о
о
,
,


ч
ч
т
т
о
о
з
з
ы
ы






и
и
ы
ы
р
р
о
о
и
и
н
н
я
я
т
т
ь
ь


р
р
а
а
ч
ч
п
п
р
р
л
л
к
к
л
л
с
с
л
л
н
н
о
о
я
я






п
п
о
о
и
и
ы
ы
ч
ч
о
о
т
т
ь
ь


р
р
а
а
ч
ч
л
л
ч
ч
т
т
и
и
о
о


н
н
а
а


р
р
о
о
н
н
т
т
р
р
о
о
с
с
л
л


Разбор задачи с
www
.
kaggle
.
com

24

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Почлму нумны клформаьоо






Рар наиочот рачлчтио от мномотлся

pmin
(
pmax
(
round
(
1.45
*(
a
-
3.309805
)+
3.309805
)
,
1
)
,
4
)



Рчтато,
3.309805



чрлкняя оьлнра.

Разбор задачи с
www
.
kaggle
.
com

25

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Дся чпраиро




Хорошая иыкача (рлс.
3
-
4) похома на хорошую иыкачу и озучлноо (3
-
4).

Псохая иыкача (1
-
2)
момлт зыть нл похома

на псохую иыкачу!

Разбор задачи с
www
.
kaggle
.
com

26

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Дся чпраиро



Рлшаюялл праиосо



плрлиокот отилты рлйрлччоонных
асйо
ротмои и орончатлсьныл.


Озычно



прочтол



томл трлзулт начтройро



очпосьнулт почтаноиру накачо

(нлплрлчлчлнол рсаччои, масол чочсо млтор у озълртои о т.п.)

Разбор задачи с
www
.
kaggle
.
com

27

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Рлшлнол позлкотлся (
Chenglong Chen
)




https://github.com/ChenglongChen/Kaggle_CrowdFlower
Разбор задачи с
www
.
kaggle
.
com

28

слайд из
28

Александр Дьяконов
(Москва, МГУ)


Moscow Data Science Meetup

27

ма
я

201
6

года


Закача

Search Results Relevance



Приложенные файлы

  • pdf 7719282
    Размер файла: 874 kB Загрузок: 0

Добавить комментарий