Ссылки. BLM Исходный код https://github.com/tigvarts/BLM Статья link.springer.com/chapter/10.1007/ 978-3-319-26123-2_19 Статья для ленивых sci-hub.cc/10.1007/978-3-319-26123-2_19.


Чтобы посмотреть этот PDF файл с форматированием и разметкой, скачайте его и откройте на своем компьютере.
Âûÿâëåíèåáîòîâ
ÈëüÿÊîçëîâ
6äåêàáðÿ2016ã.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ñîäåðæàíèå
1
Îáùèåîïðåäåëåíèÿ
2
Ôóíêöèèáîòîâ
3
Ïðèçíàêèäëÿîïðåäåëåíèÿáîòîâèìåòîäûáîðüáûñíèìè
4
Îñîáåííîñòèñîöèàëüíîãîãðàôàóáîòîâ
5
Ñïîñîáèçâëå÷åíèÿïðèçíàêîâèçãðàôà
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Áîòûèîòêóäàîíèáåðóòñÿ
Áîòûïîÿâëÿþòñÿâñîöèàëüíûõñåòÿõïî÷òèñðàçóïîñëåèõ
ñîçäàíèÿ.Òàêâòâèòåðåðàññûëêàñïàìàáûëàçàôèêñèðîâàíà
÷åðåçíåäåëþïîñëååãîîòêðûòèÿ[1]
Áîòûðåãèñòðèðóþòñÿèóïðàâëÿþòñÿ(ïîëó)àâòîìàòè÷åñêè.Êàê
ïðàâèëîîñíîâíàÿôóíêöèÿáîòîâðàññûëêàñïàìà(ðåêëàìà),
íîíåîáÿçàòåëüíî.Åñòüóáîòîâèäðóãèåôóíêöèè.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
×åìáîòûçàíèìàþòñÿ
Ðàññûëêàñïàìà
Îòïðàâêàëè÷íûõñîîáùåíèé,ïóáëèêàöèÿïîñòîâðåêëàìíîãî
õàðàêòåðà.Ýòîîäíàèçíàèáîëååðàçäðàæàþùèõäåÿòåëüíîñòåé
áîòîâ,÷àñòîìåòîäûâûÿâëåíèÿáîòîâðàñ÷èòàíûêàêðàçíà
âûÿâëåíèåáîòîâñïàìåðîâ.
Àñòðîòóðôèíã
ßâëåíèåàñòðîòóðôèíãàíàçâàíîâïîèìåíèêîìïàíèè,
ïðîèçâîäÿùåéèñêóññòâåííûéãàçîí.
Ñóòüÿâëåíèÿñîçäàíèÿâèäèìîñòèîáùåñòâåííîéïîääåðæêè
(èëèíàîáîðîò).Ýòàïîääåðæêàìîæåòçàêëþ÷àòüñÿâ
îñòàâëåíèåêîììåíòàðèåâ,âñòóïëåíèåâãðóïïû(êîòîðûå
íåîáõîäèìîïîääåðæàòü),âûðàæåíèåïîääåðæêèäðóãèìè
ìåòîäàìè(ëàéêè,ðåïîñòû)
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Äðóãèåôóíêöèèáîòîâ
Êðàòêîïðîäðóãèåïðèìåíåíèÿ
Ïîääåðæêàäðóãèõáîòîâáîòûäðóæàòäðóãñäðóãîì,
äëÿòîãî,÷òîáûëó÷øåìèìèêðèðîâàòüïîäíàñòîÿùèõ
ïîëüçîâàòåëåé.
Ìîøåííè÷åñêèåäåéñòâèÿáîòûìîãóòâûäàâàòüñåáÿçà
çíàêîìûõïîëüçîâàòåëÿèïðîñèòüïåðåâåñòèäåíüãèíàèõ
ñ÷¼ò.
Ñáîðèíôîðìàöèèêàêïðàâèëîñîöèàëüíûåñåòè
ïðåäîñòàâëÿþòáîëüøåèíôîðìàöèèäðóçüÿì
ïîëüçîâàòåëÿ(èëèäðóçüÿìäðóçåé).Áîòûìîãóòïîìî÷üâ
ñáîðåèíôîðìàöèè,äîáàâëÿÿñüâäðóçüÿêïîëüçîâàòåëÿì.
...
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Îáíàðóæåíèåèáîðüáàñáîòàìè.Ðó÷íûåìåòîäû
Áîòûðàññûëàþòñïàì.Êàêïðàâèëîñîöèàëüíàÿñåòüïîçâîëÿåò
ïîæàëîâàòüñÿíàðàññûëêóñïàìàèàäìèíèñòðàöèÿñåòèìîæåò
áëîêèðîâàòüòàêîãîïîëüçîâàòåëÿ.
Ïîäîáíûéïîäõîäíåëèø¼ííåäîñòàòêîâ:
Áîòûáëîêèðóþòñÿ
ïîñëå
ñîâåðøåíèÿíåæåëàòåëüíûõ
äåéñòâèé(ñïàìóæåðàçîñëàí)
Òàêèìîáðàçîììîæíîâûäåëèòüíåâñåõáîòîâ,íàïðèìåð
àñòðîòóðôèíãïîäîáíûìèìåòîäàìèíåâûäåëÿåòñÿ.
Áëîêèðîâêàïîëüçîâàòåëåéâðó÷íîìðåæèìåìîæåòáûòü
òðóäîçàòðàòíîé(íåîáõîäèìîïðîàíàëèçèðîâàòüáîëüøîå
êîëè÷åñòâîæàëîá)
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Àâòîìàòè÷åñêèåìåòîäû
Áîòûóïðàâëÿþòñÿàâòîìàòè÷åñêèèëèïîëóàâòîìàòè÷åñêè.
Ëþäèóïðàâëÿþòñâîèìèàêêàóíòàìèâðó÷íóþ.
Òàêèìîáðàçîìâïîâåäåíèèëþäåéèáîòîâñóùåñòâóþò
îòëè÷èÿ,îòëè÷èÿìîæíîâûÿâëÿòü,âòîì÷èñëåèìåòîäàìè
ìàøèííîãîîáó÷åíèÿ.
Äëÿïîñòðîåíèÿîáó÷àþùåéâûáîðêèìîæíîèñïîëüçîâàòü
èíôîðìàöèþîáëîêèðîâêàõïîëüçîâàòåëåé.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Îáíàðóæåíèåèáîðüáàñáîòàìè.Ìàøèííîåîáó÷åíèå
Ïîïûòêèîáíàðóæèòüáîòîâìåòîäàìèìàøèííîãîîáó÷åíèÿ
ïðåäïðèíèìàëèñüäàâíî.Êàêïðàâèëîäëÿîáíàðóæåíèÿáîòîâ
èñïîëüçîâàëîñüáîëüøîåêîëè÷åñòâîýâðèñòè÷åñêèõè
ïîëóýâðèñòè÷åñêèõïðèçíàêîâ:
1
Èñïîëüçîâàíèåñïåöèôè÷åñêèõñëîâ
2
Èñïîëüçîâàíèåñïåöèàëüíûõñëîâ(õåøòåãè,óïîìèíàíèÿ
ïîëüçîâàòåëåé)
3
Íàëè÷èåçàêîíîìåðíîñòåéâîâðåìåíèïóáëèêàöèè
ñîîáùåíèé,íåõàðàêòåðíûõäëÿëþäåé
4
Ñîîòíîøåíèåðåïîñòîâèîáû÷íûõñîîáùåíèéèò.ï.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ýâîëþöèîííàÿãîíêàâîîðóæåíèé
Íîâûåìåòîäûáîðüáûâûíóæäàþòâëàäåëüöåâáîòîâ
àäàïòèðîâàòüñÿêíîâûìóñëîâèÿìèëó÷øåìèìèêðèðîâàòüïîä
îáû÷íûõïîëüçîâàòåëåé.
Íàïðèìåðäîáàâëÿòüñëó÷àéíûåâðåìåííûåïàóçûâîòïðàâêó
ñîîáùåíèé,...
Ïðèçíàêè,õàðàêòåðíûåäëÿîäíèõáîòîâ(ñïàìåðîâ)ìîæåò
áûòüíåõàðàêòåðíîäëÿäðóãîãîòèïàáîòîâ(àñòðîòóðôèíã).
Âàæíîíåòîëüêîýôôåêòèâíîñòüîïðåäåëåíèÿñóùåñòâóþùèõ
áîòîâ,íîèòî,íàñêîëüêîëåãêîáîòûñìîãóòàäàïòèðîâàòüñÿ
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Îñîáåííîñòèãðàôà
Âðàáîòå[2]áûëîïîêàçàíî,÷òîáîòîâèìååòîñîáåííîñòè:
Áîòûïûòàþòñÿîáðàçîâàòüñîöèàëüíûåñâÿçèñî
ñëó÷àéíûìèïîëüçîâàòåëÿìè.Ýòîïîçâîëÿåòèìëó÷øå
ðàñïðîñòðàíÿòüèíôîðìàöèþ.Êàêïðàâèëîáîòûèìåþò
áîëüøèéïðîöåíòîòêàçîâ.
Áîòûìîãóòîáðàçîâûâàòüñîöèàëüíûåñâÿçèäðóãñ
äðóãîì,îáðàçîâûâàòüïëîòíûåñîîáùåñòâà[2].
Âëàäåëüöûáîòîâíåìîãóòâïîëíîéìåðåêîíòðîëèðîâàòü
ñòðóêòóðóñîöèàëüíîãîãðàôà.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Èñïîëüçîâàíèåñîöèàëüíîãîãðàôà.
Ìîòèâàöèÿ
Åñòüîñíîâàíèÿïðåäïîëàãàòü,÷òîñòðóêòóðàãðàôà
îáû÷íûõïîëüçîâàòåëåéèáîòîâîòëè÷àþòñÿ.Åñëèýòîòàê,
òîìîæíîèñïîëüçîâàòüãðàôâûÿâëåíèÿáîòîâ.
Âëàäåëüöûáîòîâíåìîãóòìåíÿòüñòðóêòóðóãðàôà
ïðîèçâîëüíûìîáðàçîì.Êòàêîìóìåòîäóòðóäíåå
àäàïòèðîâàòüñÿ.
Ñîöèàëüíûéãðàôçàíèìàåòîòíîñèòåëüíîíåáîëüøîé
îáú¼ì(îòíîñèòåëüíîäðóãèõäàííûõâñîöèàëüíîéñåòè,
íàïðèìåðñîîáùåíèé)
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ñëîæíîñòüâàíàëèçåãðàôîâ
Áîëüøèíñòâîêëàññè÷åñêèõàëãîðèòìîâêëàññèôèêàöèè(SVM,
Xgboost,...)íåìîãóòðàáîòàòüñãðàôîìíåïîñðåäñòâåííî.
Äëÿïðèìåíåíèÿàëãîðèòìîâêëàññèôèêàöèèíåîáõîäèìî
âûäåëèòüïðèçíàêèò.å.ñîïîñòàâèòüêàæäîéâåðøèíåâåêòîð
êîíå÷íîéðàçìåðíîñòè.
Embedding
Ïðåäñòàâëåíèåâåðøèíãðàôàââèäåâåêòîðàïðîèçâîäÿòñÿñ
ïîìîùüþàëãîðèòìîâGraphEmbedding.
ÂíàøåéðàáîòåèñïîëüçîâàëàñüìîäåëüBLM
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ìîäåëü1BilinearLinkModel
Îáùàÿèäåÿ
Êàæäàÿâåðøèíàèìååòñêðûòîåñîñòîÿíèå,îòâå÷àþùååçà
âåðîÿòíîñòüîáðàçîâàíèÿð¼áåð.
Íàîñíîâåñêðûòûõñîñòîÿíèéîïèñûâàåòñÿâåðîÿòíîñòü
íàáëþäàòüãðàô,êîòîðûéìûíàáëþäàåì.
Ñïîìîùüþïðèíöèïàìàêñèìóìàïðàâäîïîäîáèÿìûíàõîäèì
ñêðûòûåñîñòîÿíèÿâåðøèí,àçàòåìèñïîëüçóåìèçâêà÷åñòâå
ïðèçíàêîâäëÿêëàññèôèêàòîðà.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ôîðìàëüíîåîïèñàíèå
Óêàæäîéâåðøèíûãðàôà
u
åñòüñêðûòîåñîñòîÿíèå,
ïðåäñòàâëåííîåäâóìÿâåêòîðàìè
In
u
è
Out
u
.Çàäàäèì
âåðîÿòíîñòíóþìîäåëü:
Âåðîÿòíîñòüðåáðàèç
u
â
v
p
(
v
j
u
)=
exp
f
In
u

Out
v
g
P
w
2
V
exp
f
In
u

Out
w
g
Âåðîÿòíîñòüíàáëþäàòüðåáðî
u
!
v
:
p
(
u
;
v
)=
p
(
u
)
p
(
v
j
u
)
Âåðîÿòíîñòüïîëó÷èòüãðàô,êîòîðûéìûïîëó÷èëè
ln
P
(
G
)=
X
u
;
v
2
E
ln
(
p
(
v
j
u
))+
ln
p
(
u
)
!
max
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Êëàññèôèêàöèÿâåðøèí
Ïîñëåòîãî,êàêìûïîëó÷èëèâåêòîðíîåïðåäñòàâëåíèåâåðøèí
ìîæíîðåøàòüçàäà÷óêëàññèôèêàöèèò.å.ñîïîñòàâëÿòü
âåêòîðíîìóïðåäñòàâëåíèþâåðøèíûêëàññ
~
u
!f
Áîò,Íå_áîò
g
Òàêêàêìûíåìîæåìäîñòîâåðíîîïðåäåëèòáîòîâ(âðó÷íóþ),
èñïîëüçîâàëîñüïðåäïîëîæåíèå,÷òîáîòûýòîòåàêêàóíòû,
êîòîðûåïîäâåðãàþòñÿáëîêèðîâêå.Òàêèìîáðàçîìñèñòåìà
îáó÷àëàñüïðåäñêàçûâàòüáëîêèðîâêè.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Íåéðîííûåñåòè
Ïîñëåòîãî,êàêìûïîëó÷èëèâåêòîðíîåïðåäñòàâëåíèåâåðøèí
ìîæíîèñïîëüçîâàòüëþáîéàëãîðèòìêëàññèôèêàöèè,ìû
èñïîëüçîâàëèìíîãîñëîéíûéïåðöåïòðîí.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Êà÷åñòâîðàáîòû
Ìûìîäåëèðîâàëèðàáîòóñèñòåìñïîìîùüþñîêðûòèÿìåòîê
AUC
=
0
:
76
(ò.å.ñ
p
=
0
:
76åñëèâçÿòüáîòàèíåáîòà,òîíàøàñèñòåìà
ïîñòàâèòáîòàâûøå)
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Ññûëêè
BLM
Èñõîäíûéêîä
https://github.com/tigvarts/BLM
Ñòàòüÿ
http://link.springer.com/chapter/10.1007/
978-3-319-26123-2_19
Ñòàòüÿäëÿëåíèâûõ
http://sci-hub.cc/10.1007/978-3-319-26123-2_19
DeepWalk
Èñõîäíûéêîä
https://github.com/phanein/deepwalk
Ñòàòüÿ
https://arxiv.org/abs/1403.6652
Ïðèìåíåíèåâdde
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ
Áèáëèîãðàôèÿ
PranamKolari,TimFinin,andAJoshi.
Spaminblogsandsocialmedia.
TutorialatICWSM
,pages307361,2007.
ChaoYang,RobertHarkreader,JialongZhang,Seungwon
Shin,andGuofeiGu.
ÈëüÿÊîçëîâ
Âûÿâëåíèåáîòîâ

Приложенные файлы

  • pdf 9412946
    Размер файла: 218 kB Загрузок: 0

Добавить комментарий