ΠΠ²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ° ΡΠ΅ΠΊΡΡΠΎΠ²
ΠΠΊΠ°ΡΠ΅ΡΠΈΠ½Π° Π§Π΅ΡΠ½ΡΠΊ
Π΄ΠΠΠΠ Π€ΠΠ ΠΠΠ£ ΠΠ¨Π
[email protected]
ΠΠ²Π΅Π΄Π΅Π½ΠΈΠ΅
ΠΡΠ°ΡΠΊΠ°Ρ ΠΈΡΡΠΎΡΠΈΡ
7 ΡΠ½Π²Π°ΡΡ 1954. ΠΠΆΠΎΡΠ΄ΠΆΡΠ°ΡΠ½ΡΠΊΠΈΠΉ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½Ρ ΠΏΠΎ ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌΡ ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄Ρ Ρ ΡΡΡΡΠΊΠΎΠ³ΠΎ Π½Π° Π°Π½Π³Π»ΠΈΠΉΡΠΊΠΈΠΉ;
1957 Π³., ΠΠΎΠ°ΠΌ Π₯ΠΎΠΌΡΠΊΠΈΠΉ Π²Π²Π΅Π» "ΡΠ½ΠΈΠ²Π΅ΡΡΠ°Π»ΡΠ½ΡΡ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΡ";
1961 Π³., ΠΠ°ΡΠΈΠ½Π°Π΅ΡΡΡ ΡΠ±ΠΎΡ ΠΡΠ°ΡΠ½ΠΎΠ²ΡΠΊΠΎΠ³ΠΎ ΠΊΠΎΡΠΏΡΡΠ°;
ΠΊΠΎΠ½Π΅Ρ 1960-Ρ Π³Π³., ELIZA β- ΠΏΡΠΎΠ³ΡΠ°ΠΌΠΌΠ°, Π²Π΅Π΄ΡΡΠ°Ρ ΠΏΡΠΈΡ ΠΎΡΠ΅ΡΠ°ΠΏΠ΅Π²ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΡΠ°Π·Π³ΠΎΠ²ΠΎΡΡ;
1975 Π³., Π‘ΠΎΠ»ΡΠΎΠ½ Π²Π²Π΅Π» Π²Π΅ΠΊΡΠΎΡΠ½ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ (Vector Space Model, VSM);
Π΄ΠΎ 1980βΡ . ΠΠ΅ΡΠΎΠ΄Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π° ΠΏΡΠ°Π²ΠΈΠ»Π°Ρ ;
ΠΏΠΎΡΠ»Π΅ 1980βΡ Π³Π³., ΠΠ΅ΡΠΎΠ΄Ρ ΡΠ΅ΡΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ, ΠΎΡΠ½ΠΎΠ²Π°Π½Π½ΡΠ΅ Π½Π° ΠΌΠ°ΡΠΈΠ½Π½ΠΎΠΌ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠΈ ΠΈ ΠΊΠΎΡΠΏΡΡΠ½ΠΎΠΉ Π»ΠΈΠ½Π³Π²ΠΈΡΡΠΈΠΊΠ΅;
1998 Π³., ΠΠΎΠ½ΡΠ΅ ΠΈ ΠΡΠΎΡΡ Π²Π²ΠΎΠ΄ΡΡ ΡΠ·ΡΠΊΠΎΠ²ΡΡ ΠΌΠΎΠ΄Π΅Π»Ρ (Language Model, LM);
ΠΊΠΎΠ½Π΅Ρ 1990βΡ Π³Π³., ΠΠ΅ΡΠΎΡΡΠ½ΠΎΡΡΠ½ΡΠ΅ ΡΠ΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ (LSI, pLSI, LDA, ΠΈ Ρ.Π΄.);
1999 Π³., ΠΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ ΡΡΠ΅Π±Π½ΠΈΠΊ ΠΠ°Π½Π½ΠΈΠ½Π³Π° ΠΈ Π©ΡΡΡΠ΅ "ΠΡΠ½ΠΎΠ²Ρ ΡΡΠ°ΡΠΈΡΡΠΈΡΠ΅ΡΠΊΠΎΠΉ Π°Π²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠΉ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠΈ ΡΠ΅ΠΊΡΡΠΎΠ²" ("Foundations of Statistical Natural Language Processing");
2009 Π³.. ΠΠΏΡΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½ ΡΡΠ΅Π±Π½ΠΈΠΊ ΠΠ΅ΡΠ΄Π°, ΠΠ»ΡΠΉΠ½Π° ΠΈ ΠΠΎΠΏΠ΅ΡΠ° "ΠΠ²ΡΠΎΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠ°Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ° ΡΠ΅ΠΊΡΡΠΎΠ² Π½Π° Python" ("Natural Language Processing with Python);
Mikolov, Tomas ΠΈ Π΄Ρ. "Efficient estimation of word representations in vector space".
ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ Π·Π°Π΄Π°ΡΠΈ
ΠΠ°ΡΠΈΠ½Π½ΡΠΉ ΠΏΠ΅ΡΠ΅Π²ΠΎΠ΄
ΠΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ²
Π€ΠΈΠ»ΡΡΡΠ°ΡΠΈΡ ΡΠΏΠ°ΠΌΠ°
ΠΠΎ ΡΠΎΠ½Π°Π»ΡΠ½ΠΎΡΡΠΈ
ΠΠΎ ΡΠ΅ΠΌΠ΅ ΠΈΠ»ΠΈ ΠΆΠ°Π½ΡΡ
ΠΠ»Π°ΡΡΠ΅ΡΠΈΠ·Π°ΡΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ²
ΠΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΈ
Π€Π°ΠΊΡΠΎΠ² ΠΈ ΡΠΎΠ±ΡΡΠΈΠΉ
ΠΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½ΡΡ ΡΡΡΠ½ΠΎΡΡΠ΅ΠΉ
ΠΠΎΠΏΡΠΎΡΠ½ΠΎ-ΠΎΡΠ²Π΅ΡΠ½ΡΠ΅ ΡΠΈΡΡΠ΅ΠΌΡ
Π‘ΡΠΌΠΌΠ°ΡΠΈΠ·Π°ΡΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ²
ΠΠ΅Π½Π΅ΡΠ°ΡΠΈΡ ΡΠ΅ΠΊΡΡΠΎΠ²
Π Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΡΠ΅ΡΠΈ
ΠΡΠΎΠ²Π΅ΡΠΊΠ° ΠΏΡΠ°Π²ΠΎΠΏΠΈΡΠ°Π½ΠΈΡ
ΠΠΏΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΡΠ°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ²
ΠΠΎΠ»ΡΠ·ΠΎΠ²Π°ΡΠ΅Π»ΡΡΠΊΠΈΠ΅ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΡ ΠΈ ΠΎΡΠ΅Π½ΠΊΠ° ΡΠΎΡΠ½ΠΎΡΡΠΈ ΠΈ ΠΊΠ°ΡΠ΅ΡΡΠ²Π° ΠΌΠ΅ΡΠΎΠ΄ΠΎΠ²
ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΡΠ΅Ρ Π½ΠΈΠΊΠΈ
Π£ΡΠΎΠ²Π΅Π½Ρ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ²:
Π’ΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΈΡ: ΡΠ°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ° Π½Π° ΡΠ»ΠΎΠ²Π°
Π Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ ΡΠ΅ΠΊΡΡΠ° Π½Π° ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΡ
Π£ΡΠΎΠ²Π΅Π½Ρ ΡΠ»ΠΎΠ² β ΠΌΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡ:
Π Π°Π·ΠΌΠ΅ΡΠΊΠ° ΡΠ°ΡΡΠ΅ΠΉ ΡΠ΅ΡΠΈ
Π‘Π½ΡΡΠΈΠ΅ ΠΌΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠΉ Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΠΈ
Π£ΡΠΎΠ²Π΅Π½Ρ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ β ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡ:
ΠΡΠ΄Π΅Π»Π΅Π½Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π½Π½ΡΡ ΠΈΠ»ΠΈ Π³Π»Π°Π³ΠΎΠ»ΡΠ½ΡΡ Π³ΡΡΠΏΠΏ (chunking)
ΠΡΠ΄Π΅Π»Π΅Π½Π½ΠΈΠ΅ ΡΠ΅ΠΌΠ°Π½ΡΠΈΡΠ΅ΡΠΊΠΈΡ ΡΠΎΠ»Π΅ΠΉ
ΠΠ΅ΡΠ΅Π²ΡΡ ΡΠΎΡΡΠ°Π²Π»ΡΡΡΠΈΡ ΠΈ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠ΅ΠΉ
Π£ΡΠΎΠ²Π΅Π½Ρ ΡΠΌΡΡΠ»Π° β ΡΠ΅ΠΌΠ°Π½ΡΠΈΠΊΠ° ΠΈ Π΄ΠΈΡΠΊΡΡΡ:
Π Π°Π·ΡΠ΅ΡΠ΅Π½ΠΈΠ΅ ΠΊΠΎΡΠ΅ΡΠ΅ΡΠ΅Π½ΡΠ½ΡΡ ΡΠ²ΡΠ·Π΅ΠΉ
ΠΠ½Π°Π»ΠΈΠ· Π΄ΠΈΡΠΊΡΡΡΠΈΠ²Π½ΡΡ ΡΠ²ΡΠ·Π΅ΠΉ
ΠΡΠ΄Π΅Π»Π΅Π½ΠΈΠ΅ ΡΠΈΠ½ΠΎΠ½ΠΈΠΌΠΎΠ²
ΠΠ½Π°Π»ΠΈΠ· Π°ΡΠ³ΡΠΌΠ΅Π½ΡΠ°ΡΠΈΠ²Π½ΡΡ ΡΠ²ΡΠ·Π΅ΠΉ
ΠΡΠ½ΠΎΠ²Π½ΡΠ΅ ΠΏΡΠΎΠ±Π»Π΅ΠΌΡ
ΠΠ΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΡ
ΠΠ΅ΠΊΡΠΈΡΠ΅ΡΠΊΠ°Ρ Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΡ: ΠΎΡΠ³Π°Π½, ΠΏΠ°ΡΠΈΡΡ, ΡΠΎΠΆΠΊΠΈ, Π°ΡΠ»Π°Ρ
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠ°Ρ Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΡ: Π₯ΡΠ°Π½Π΅Π½ΠΈΠ΅ Π΄Π΅Π½Π΅Π³ Π² Π±Π°Π½ΠΊΠ΅. Π§ΡΠΎ Π΄Π΅Π»Π°ΡΡ Π±Π΅Π»ΠΊΠΈ Π² ΠΊΠ»Π΅ΡΠΊΠ΅?
Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠ°Ρ Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΡ: ΠΡΠΆΡ ΠΈΠ·ΠΌΠ΅Π½ΡΡΡ Π½Π΅Π»ΡΠ·Ρ. ΠΠ³ΠΎ ΡΠ΄ΠΈΠ²ΠΈΠ» ΠΏΡΠΎΡΡΠΎΠΉ ΡΠΎΠ»Π΄Π°Ρ.
ΠΠ΅ΠΎΠ»ΠΎΠ³ΠΈΠ·ΠΌΡ: ΠΏΠ΅ΡΠ΅Π½ΡΠΊΠΈ, Π·Π°ΠΈΠ½ΡΡΠ°Π³ΡΠ°ΠΌΠΌΠΈΡΡ, ΡΠ΅ΠΏΠΎΡΡΠ½ΡΡΡ, ΡΠ°ΡΡΠ°ΡΠΈΡΡ, Π·Π°ΡΠ°ΡΠΈΡΡ, ΠΊΠΈΠ»ΠΎΡΡΠ±Π»ΠΈ
Π Π°Π·Π½ΡΠ΅ Π²Π°ΡΠΈΠ°Π½ΡΡ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΡ: Π ΠΎΡΡΠΈΡ, Π ΠΎΡΡΠΈΠΉΡΠΊΠ°Ρ Π€Π΅Π΄Π΅ΡΠ°ΡΠΈΡ, Π Π€
ΠΠ΅ΡΡΠ°Π½Π΄Π°ΡΡΠ½ΠΎΠ΅ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΠ΅: ΠΊΠ°Π³ Π΄ΠΈΠ»Π°?
Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠ°Ρ Π½Π΅ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½ΠΎΡΡΡ
I saw the man. The man was on the hill. I was using a telescope.
I saw the man. I was on the hill. I was using a telescope.
I saw the man. The man was on the hill. The hill had a telescope.
I saw the man. I was on the hill. The hill had a telescope.
I saw the man. The man was on the hill. I saw him using a telescope.
ΠΠ»Π°Π½
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡ. Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡ. ΠΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ ΠΊΠ»ΡΡΠ΅Π²ΡΡ ΡΠ»ΠΎΠ² ΠΈ ΡΠ»ΠΎΠ²ΠΎΡΠΎΡΠ΅ΡΠ°Π½ΠΈΠΉ.
ΠΠ΅ΠΊΡΠΎΡΠ½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠ° ΠΈ ΠΈΠ½ΡΠΎΡΠΌΠ°ΡΠΈΠΎΠ½Π½ΡΠΉ ΠΏΠΎΠΈΡΠΊ. ΠΠ΅ΠΊΡΠΎΡΠ½Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ ΡΠ»ΠΎΠ²Π° ΠΈ Π΄ΠΈΡΡΡΠΈΠ±ΡΡΠΈΠ²Π½Π°Ρ ΡΠ΅ΠΌΠ°Π½ΡΠΈΠΊΠ°. ΠΠ΅ΡΠΎΠ΄Ρ ΡΠ½ΠΈΠΆΠ΅Π½ΠΈΡ ΡΠ°Π·ΠΌΠ΅ΡΠ½ΠΎΡΡΠΈ. Π’Π΅ΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΎΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅, word2vec, GloVe
ΠΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ Π΄ΠΎΠΊΡΠΌΠ΅Π½ΡΠΎΠ² ΠΈ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΈΡ ΠΏΠΎΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΠ½ΠΎΡΡΠ΅ΠΉ. Π‘Π²Π΅ΡΡΠΎΡΠ½ΡΠ΅ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΠ΅ ΡΠ΅ΡΠΈ, ΡΡΠ»ΠΎΠ²Π½ΡΠ΅ ΡΠ»ΡΡΠ°ΠΉΠ½ΡΠ΅ ΠΏΠΎΠ»Ρ.
Π―Π·ΡΠΊΠΎΠ²Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ. ΠΠ΅ΠΉΡΠΎΠ½Π½Π°Ρ ΡΠ·ΡΠΊΠΎΠ²Π°Ρ ΠΌΠΎΠ΄Π΅Π»Ρ. Π Π΅ΠΊΠΊΡΡΠ΅Π½ΡΠ½ΡΠ΅ Π½Π΅ΠΉΡΠΎΠ½Π½ΡΠ΅ ΡΠ΅ΡΠΈ. ΠΠ·Π²Π»Π΅ΡΠ΅Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π½ΠΎΠ²Π°Π½Π½ΡΡ ΡΡΡΠ½ΠΎΡΡΠ΅ΠΉ.
Π’ΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΈΡ ΠΈ ΠΏΠΎΠ΄ΡΡΠ΅Ρ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΡΠ»ΠΎΠ²
Π‘ΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ»ΠΎΠ² Π² ΡΡΠΎΠΌ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΈ?
ΠΠ° Π΄Π²ΠΎΡΠ΅ ΡΡΠ°Π²Π°, Π½Π° ΡΡΠ°Π²Π΅ Π΄ΡΠΎΠ²Π°, Π½Π΅ ΡΡΠ±ΠΈ Π΄ΡΠΎΠ²Π° Π½Π° ΡΡΠ°Π²Π΅ Π΄Π²ΠΎΡΠ°.*
** 12 ΡΠΎΠΊΠ΅Π½ΠΎΠ²** : ΠΠ°, Π΄Π²ΠΎΡΠ΅, ΡΡΠ°Π²Π°, Π½Π°, ΡΡΠ°Π²Π΅, Π΄ΡΠΎΠ²Π°, Π½Π΅, ΡΡΠ±ΠΈ, Π΄ΡΠΎΠ²Π°, Π½Π°, ΡΡΠ°Π²Π΅, Π΄Π²ΠΎΡΠ°
** 8 - 9 ΡΠΈΠΏΠΎΠ²** : Π/Π½Π°, Π΄Π²ΠΎΡΠ΅, ΡΡΠ°Π²Π°, ΡΡΠ°Π²Π΅, Π΄ΡΠΎΠ²Π°, Π½Π΅, ΡΡΠ±ΠΈ, Π΄Π²ΠΎΡΠ°.
** 6 Π»Π΅ΠΊΡΠ΅ΠΌ** : Π½Π°, Π½Π΅, Π΄Π²ΠΎΡ, ΡΡΠ°Π²Π°, Π΄ΡΠΎΠ²Π°, ΡΡΠ±ΠΈΡΡ
Π’ΠΎΠΊΠ΅Π½ ΠΈ ΡΠΈΠΏ
** Π’ΠΈΠΏ ** β ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΠΎΠ΅ ΡΠ»ΠΎΠ²ΠΎ ΠΈΠ· ΡΠ΅ΠΊΡΡΠ°
** Π’ΠΎΠΊΠ΅Π½ ** β ΡΠΈΠΏ ΠΈ Π΅Π³ΠΎ ΠΏΠΎΠ·ΠΈΡΠΈΡ Π² ΡΠ΅ΠΊΡΡΠ΅
ΠΠ±ΠΎΠ·Π½Π°ΡΠ΅Π½ΠΈΡ
= ΡΠΈΡΠ»ΠΎ ΡΠΎΠΊΠ΅Π½ΠΎΠ²
β ΡΠ»ΠΎΠ²Π°ΡΡ (Π²ΡΠ΅ ΡΠΈΠΏΡ)
= ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠΈΠΏΠΎΠ² Π² ΡΠ»ΠΎΠ²Π°ΡΠ΅
** ΠΠ°ΠΊ ΡΠ²ΡΠ·Π°Π½Ρ ΠΈ ?**
ΠΠ°ΠΊΠΎΠ½ Π¦ΠΈΠΏΡΠ°
Π Π»ΡΠ±ΠΎΠΌ Π΄ΠΎΡΡΠ°ΡΠΎΡΠ½ΠΎ Π±ΠΎΠ»ΡΡΠΎΠΌ ΡΠ΅ΠΊΡΡΠ΅ ΡΠ°Π½Π³ ΡΠΈΠΏΠ° ΠΎΠ±ΡΠ°ΡΠ½ΠΎ ΠΏΡΠΎΠΏΠΎΡΡΠΈΠΎΠ½Π°Π»Π΅Π½ Π΅Π³ΠΎ ΡΠ°ΡΡΠΎΡΠ΅:
β ΡΠ°ΡΡΠΎΡΠ° ΡΠΈΠΏΠ°, β ΡΠ°Π½Π³ ΡΠΈΠΏΠ°, β ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ, Π΄Π»Ρ ΡΠ»Π°Π²ΡΠ½ΡΠΊΠΈΡ ΡΠ·ΡΠΊΠΎΠ² β ΠΎΠΊΠΎΠ»ΠΎ 0.07
ΠΠ°ΠΊΠΎΠ½ Π₯ΠΈΠΏΡΠ°
Π‘ ΡΠ²Π΅Π»ΠΈΡΠ΅Π½ΠΈΠ΅ΠΌ Π΄Π»ΠΈΠ½Ρ ΡΠ΅ΠΊΡΡΠ° (ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²Π° ΡΠΎΠΊΠ΅Π½ΠΎΠ²), ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠΈΠΏΠΎΠ² ΡΠ²Π΅Π»ΠΈΡΠΈΠ²Π°Π΅ΡΡΡ Π² ΡΠΎΠΎΡΠ²Π΅ΡΡΡΠ²ΠΈΠΈ Ρ Π·Π°ΠΊΠΎΠ½ΠΎΠΌ:
β ΡΠΈΡΠ»ΠΎ ΡΠΎΠΊΠ΅Π½ΠΎΠ², β ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠΈΠΏΠΎΠ² Π² ΡΠ»ΠΎΠ²Π°ΡΠ΅, β ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡΡ, ΠΎΠ±ΡΡΠ½ΠΎ
ΠΠ½Π°Π»ΠΈΠ· Π½ΠΎΠ²ΠΎΡΡΠ½ΡΡ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠΉ
Π Π°ΡΡΠΌΠΎΡΡΠΈΠΌ ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΡ Π½ΠΎΠ²ΠΎΡΡΠ½ΡΡ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠΉ Π·Π° ΠΏΠ΅ΡΠ²ΡΡ ΠΏΠΎΠ»ΠΎΠ²ΠΈΠ½Ρ 2017 Π³ΠΎΠ΄Π°. ΠΡΠΎ ΠΊΠ°ΠΆΠ΄ΠΎΠ΅ Π½ΠΎΠ²ΠΎΡΡΠ½ΠΎΠ΅ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠ΅ ΠΈΠ·Π²Π΅ΡΡΠ½Ρ:
Π΅Π³ΠΎ Π·Π°Π³ΠΎΠ»ΠΎΠ²ΠΎΠΊ ΠΈ ΡΠ΅ΠΊΡΡ
Π΄Π°ΡΠ° Π΅Π³ΠΎ ΠΏΡΠ±Π»ΠΈΠΊΠ°ΡΠΈΠΈ
ΡΠΎΠ±ΡΡΠΈΠ΅, ΠΎ ΠΊΠΎΡΠΎΡΠΎΠΌ ΡΡΠΎ Π½ΠΎΠ²ΠΎΡΡΠ½ΠΎΠ΅ ΡΠΎΠΎΠ±ΡΠ΅Π½ΠΈΠ΅ Π½Π°ΠΏΠΈΡΠ°Π½ΠΎ
Π΅Π³ΠΎ ΡΡΠ±ΡΠΈΠΊΠ°
ΠΡΠ΅Π΄Π²Π°ΡΠΈΡΠ΅Π»ΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· ΠΊΠΎΠ»Π»Π΅ΠΊΡΠΈΠΈ
Π‘ΡΠ΅Π΄Π½ΡΡ Π΄Π»ΠΈΠ½Π° ΡΠ΅ΠΊΡΡΠΎΠ²
ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ΅ΠΊΡΡΠΎΠ² ΠΎ ΡΠ°Π·Π½ΡΡ ΡΠΎΠ±ΡΡΠΈΡΡ
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<ipython-input-2-4e6b87a33326> in <module>()
----> 1 from bokeh.charts import Bar, output_notebook, show, hplot
2 import math
3 output_notebook()
4
5 counts = df.event.value_counts()
ImportError: No module named 'bokeh.charts'
ΠΠ»ΠΈΠ½Ρ ΡΠ΅ΠΊΡΡΠΎΠ² (Π² ΡΠΈΠΌΠ²ΠΎΠ»Π°Ρ )
Π’ΠΎΠΊΠ΅Π½ΠΈΠ·Π°ΡΠΈΡ
ΠΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΠΌ ΡΠ΅Π³ΡΠ»ΡΡΠ½ΡΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ, ΡΡΠΎΠ±Ρ ΡΠ°Π·Π±ΠΈΡΡ ΡΠ΅ΠΊΡΡΡ Π½Π° ΡΠ»ΠΎΠ²Π°
Π‘Π°ΠΌΡΠ΅ ΡΠ°ΡΡΡΠ΅ ΡΠ»ΠΎΠ²Π°
ΠΠ°ΠΊΠΎΠ½ Π¦ΠΈΠΏΡΠ°
ΠΠ°ΠΊΠΎΠ½ Π₯ΠΈΠΏΡΠ°
Π Π΅Π³ΡΠ»ΡΡΠ½ΡΠ΅ Π²ΡΡΠ°ΠΆΠ΅Π½ΠΈΡ ΠΏΠΎΠ΄ΡΠΎΠ±Π½Π΅Π΅
ΠΠ»Π°ΡΡΡ ΡΠΈΠΌΠ²ΠΎΠ»ΠΎΠ²:
[A-Z] β ΡΠΈΠΌΠ²ΠΎΠ»Ρ Π²Π΅ΡΡ Π½Π΅Π³ΠΎ ΡΠ΅Π³ΠΈΡΡΡΠ° (Π»Π°ΡΠΈΠ½ΠΈΡΠ°)
[a-z] β ΡΠΈΠΌΠ²ΠΎΠ»Ρ Π½ΠΈΠΆΠ½Π΅Π³ΠΎ ΡΠ΅Π³ΠΈΡΡΡΠ° (Π»Π°ΡΠΈΠ½ΠΈΡΠ°)
[Π-Π―] β ΡΠΈΠΌΠ²ΠΎΠ»Ρ Π²Π΅ΡΡ Π½Π΅Π³ΠΎ ΡΠ΅Π³ΠΈΡΡΡΠ° (ΠΊΠΈΡΠΈΠ»Π»ΠΈΡΠ°)
[Π°-Ρ] β ΡΠΈΠΌΠ²ΠΎΠ»Ρ Π½ΠΈΠΆΠ½Π΅Π³ΠΎ ΡΠ΅Π³ΠΈΡΡΡΠ° (ΠΊΠΈΡΠΈΠ»Π»ΠΈΡΠ°)
[0-9] ΠΈΠ»ΠΈ \d β ΡΠΈΡΡΠ°
[^0-9] ΠΈΠ»ΠΈ \D β Π»ΡΠ±ΠΎΠΉ ΡΠΈΠΌΠ²ΠΎΠ», ΠΊΡΠΎΠΌΠ΅ ΡΠΈΡΡΡ
. β Π»ΡΠ±ΠΎΠΉ ΡΠΈΠΌΠ²ΠΎΠ»
Π‘Π»ΡΠΆΠ΅Π±Π½ΡΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»Ρ:
\t β ΡΠ°Π±ΡΠ»ΡΡΠΈΡ
\s β Π»ΡΠ±ΠΎΠΉ ΠΏΡΠΎΠ±Π΅Π»ΡΠ½ΡΠΉ ΡΠΈΠΌΠ²ΠΎΠ»
\S β Π²ΡΠ΅ ΡΠΈΠΌΠ²ΠΎΠ»Ρ, ΠΊΡΠΎΠΌΠ΅ ΠΏΡΠΎΠ±Π΅Π»ΡΠ½ΡΡ
\n β ΠΏΠ΅ΡΠ΅Π½ΠΎΡ ΡΡΡΠΎΠΊΠΈ
^ β Π½Π°ΡΠ°Π»ΠΎ ΡΡΡΠΎΠΊΠΈ
$ β ΠΊΠΎΠ½Π΅Ρ ΡΡΡΠΎΠΊΠΈ
__ β ΡΠΊΡΠ°Π½ΠΈΡΠΎΠ²Π°Π½ΠΈΠ΅
ΠΠΏΠ΅ΡΠ°ΡΠΎΡΡ:
? - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ Π±ΡΡΡ, Π° ΠΌΠΎΠΆΠ΅Ρ Π½Π΅ Π±ΡΡΡ
+ - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ²ΡΠΎΡΡΡΡΡΡ 1 ΠΈ Π±ΠΎΠ»Π΅Π΅ ΡΠ°Π·
* - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ²ΡΠΎΡΡΡΡΡΡ 0 ΠΈ Π±ΠΎΠ»Π΅Π΅ ΡΠ°Π·
{n,m} - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ²ΡΠΎΡΡΡΡΡΡ ΠΎΡ ΠΎΡ n Π΄ΠΎ m Π²ΠΊΠ»ΡΡΠΈΡΠ΅Π»ΡΠ½ΠΎ
{n,} - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° Π² ΡΠΊΠΎΠ±ΠΊΠ°Ρ ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ²ΡΠΎΡΡΡΡΡΡ n ΠΈ Π±ΠΎΠ»Π΅Π΅ ΡΠ°Π·
{,m} - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΌΠΎΠΆΠ΅Ρ ΠΏΠΎΠ²ΡΠΎΡΡΡΡΡΡ Π΄ΠΎ m ΡΠ°Π·
{n} - ΠΏΡΠ΅Π΄ΡΠ΄ΡΡΠΈΠΉ ΡΠΈΠΌΠ²ΠΎΠ»/Π³ΡΡΠΏΠΏΠ° ΠΏΠΎΠ²ΡΠΎΡΡΠ΅ΡΡΡ n ΡΠ°Π·
ΠΠ½ΡΡΡΠΈ Π³ΡΡΠΏΠΏ Π½Π΅ ΡΠ°Π±ΠΎΡΠ°ΡΡ ΠΎΠΏΠ΅ΡΠ°ΡΠΎΡΡ ., +, *, ΠΈΡ Π½Π΅ΠΎΠ±Ρ ΠΎΠ΄ΠΈΠΌΠΎ ΡΠΊΡΠ°Π½ΠΈΡΠΎΠ²Π°ΡΡ Ρ ΠΏΠΎΠΌΠΎΡΡΡ ΠΎΠ±ΡΠ°ΡΠ½ΠΎΠ³ΠΎ ΡΠ»Π΅ΡΠ°: \
ΠΠ΅ΡΠΎΠ΄Ρ:
re.match(pattern, string) - Π½Π°ΠΉΡΠΈ ΠΏΠΎΠ΄ΡΡΡΠΎΠΊΡ pattern Π² Π½Π°ΡΠ°Π»Π΅ ΡΡΡΠΎΠΊΠΈ string
re.search(pattern, string) - Π°Π½Π°Π»ΠΎΠ³ΠΈΡΠ΅Π½ ΠΌΠ΅ΡΠΎΠ΄Ρ match, Π½ΠΎ ΠΈΡΠ΅Ρ Π½Π΅ ΡΠΎΠ»ΡΠΊΠΎ Π² Π½Π°ΡΠ°Π»Π΅ ΡΡΡΠΎΠΊΠΈ (Π½ΠΎ Π²ΠΎΠ·Π²ΡΠ°ΡΠ°Π΅Ρ ΡΠΎΠ»ΡΠΊΠΎ ΠΏΠ΅ΡΠ²ΠΎΠ΅ Π²Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅!)
re.findall(pattern, string) - Π²ΠΎΠ·Π²ΡΠ°ΡΠ°Π΅Ρ Π²ΡΠ΅ Π²Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ pattern Π² string Π² Π²ΠΈΠ΄Π΅ ΡΠΏΠΈΡΠΊΠ°
re.split(pattern, string, [maxsplit=0]) - ΡΠ°Π·Π΄Π΅Π»ΡΠ΅Ρ ΡΡΡΠΎΠΊΡ string ΠΏΠΎ ΡΠ°Π±Π»ΠΎΠ½Ρ pattern; ΠΏΠ°ΡΠ°ΠΌΠ΅ΡΡ maxsplit ΠΎΡΠ²Π΅ΡΠ°Π΅Ρ Π·Π° ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡΠ½ΠΎΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ°Π·Π±ΠΈΠ΅Π½ΠΈΠΉ (Π΅ΡΠ»ΠΈ ΠΈΡ ΡΡΡΠ΅ΡΡΠ²ΡΠ΅Ρ Π½Π΅ΡΠΊΠΎΠ»ΡΠΊΠΎ).
re.sub(pattern, string2, string1) - Π·Π°ΠΌΠ΅Π½ΡΠ΅Ρ Π²ΡΠ΅ Π²Ρ ΠΎΠΆΠ΄Π΅Π½ΠΈΡ pattern Π² string1 Π½Π° srting2
re.compile(pattern) - ΡΠΎΠ·Π΄Π°Π΅Ρ ΠΎΠ±ΡΠ΅ΠΊΡ Π΄Π»Ρ ΠΏΠΎΡΠ»Π΅Π΄ΡΡΡΠ΅Π³ΠΎ ΠΏΠΎΠΈΡΠΊΠ°
ΠΠ°Π΄Π°Π½ΠΈΠ΅ 1
ΠΠ°ΠΉΠ΄ΠΈΡΠ΅ Π² ΡΠ΅ΠΊΡΡΠ΅ Π²ΡΠ΅ Π½ΠΎΠΌΠ΅ΡΠ° ΡΠ΅Π»Π΅ΡΠΎΠ½ΠΎΠ²; ΡΠ΅ΠΊΡΡ Π»Π΅ΠΆΠΈΡ Π² ΡΠ°ΠΉΠ»Π΅ 'task1.txt'. ΠΠ±ΡΠ°ΡΠΈΡΠ΅ Π²Π½ΠΈΠΌΠ°Π½ΠΈΠ΅ Π½Π° Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΡΠ΅ ΡΠΎΡΠΌΠ°ΡΡ Π½Π°ΠΏΠΈΡΠ°Π½ΠΈΡ Π½ΠΎΠΌΠ΅ΡΠΎΠ².
Π‘Π΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΡ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ
"?", "!" ΠΊΠ°ΠΊ ΠΏΡΠ°Π²ΠΈΠ»ΠΎ ΠΎΠ΄Π½ΠΎΠ·Π½Π°ΡΠ½Ρ. ΠΡΠΎΠ±Π»Π΅ΠΌΡ Π²ΠΎΠ·Π½ΠΈΠΊΠ°ΡΡ Ρ ".".
ΠΠΈΠ½Π°ΡΠ½ΡΠΉ ΠΊΠ»Π°ΡΡΠΈΡΠΈΠΊΠ°ΡΠΎΡ Π΄Π»Ρ ΡΠ΅Π³ΠΌΠ΅Π½ΡΠ°ΡΠΈΠΈ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ: Π΄Π»Ρ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΡΠΎΡΠΊΠΈ "." ΠΎΠΏΡΠ΅Π΄Π΅Π»ΠΈΡΡ, ΡΠ²Π»ΡΠ΅ΡΡΡ Π»ΠΈ ΠΎΠ½Π° ΠΊΠΎΠ½ΡΠΎΠΌ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΡ ΠΈΠ»ΠΈ Π½Π΅Ρ.
ΠΠ°Π΄Π°Π½ΠΈΠ΅ 2
ΠΠΎΡΡΠΈΡΠ°ΠΉΡΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠΎΠΊΠ΅Π½ΠΎΠ² ΠΈ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΉ Π² ΡΠ΅ΠΊΡΡΠ΅ ΠΈΠ· ΡΠ°ΠΉΠ»Π° task2.txt. Π‘ΠΎΡ ΡΠ°Π½ΠΈΡΠ΅ ΡΠΏΠΈΡΠΎΠΊ ΡΠΎΠΊΠ΅Π½ΠΎΠ² Π² ΠΌΠ°ΡΡΠΈΠ² tokens.
Π§Π°ΡΡΠΎΡΠ½ΡΠΉ Π°Π½Π°Π»ΠΈΠ· ΡΠ΅ΠΊΡΡΠ°
ΠΠ°Π΄Π°Π½ΠΈΠ΅ 3
ΠΠΎΡΡΠΈΡΠ°ΠΉΡΠ΅, ΡΠΊΠΎΠ»ΡΠΊΠΎ ΡΠ»ΠΎΠ² Π² ΡΠ΅ΠΊΡΡΠ΅ task2 Π²ΡΡΡΠ΅ΡΠ°Π΅ΡΡΡ Π±ΠΎΠ»ΡΡΠ΅ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΡΠ°Π·Π°.
ΠΠΎΡΡΠΈΡΠ°ΠΉΡΠ΅ ΠΊΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΠ»ΠΎΠ², ΡΠΎΡΡΠΎΡΡΠΈΡ ΠΈΠ· 5 Π±ΡΠΊΠ² ΠΈ Π±ΠΎΠ»Π΅Π΅.
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·
ΠΠ°Π΄Π°ΡΠΈ ΠΌΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°
Π Π°Π·Π±ΠΎΡ ΡΠ»ΠΎΠ²Π° β ΠΎΠΏΡΠ΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ Π½ΠΎΡΠΌΠ°Π»ΡΠ½ΠΎΠΉ ΡΠΎΡΠΌΡ (Π»Π΅ΠΌΠΌΡ), ΠΎΡΠ½ΠΎΠ²Ρ (ΡΡΠ΅ΠΌΠ°) ΠΈ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΡ Ρ Π°ΡΠ°ΠΊΡΠ΅ΡΠΈΡΡΠΈΠΊ ΡΠ»ΠΎΠ²Π°
Π‘ΠΈΠ½ΡΠ΅Π· ΡΠ»ΠΎΠ²Π° β Π³Π΅Π½Π΅ΡΠ°ΡΠΈΡ ΡΠ»ΠΎΠ²Π° ΠΏΠΎ Π·Π°Π΄Π°Π½Π½ΡΠΌ Π³ΡΠ°ΠΌΠΌΠ°ΡΠΈΡΠ΅ΡΠΊΠΈΠΌ Ρ Π°ΡΠ°ΠΊΡΠ΅ΡΠΈΡΡΠΈΠΊΠ°ΠΌ
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΠΏΡΠΎΡΠ΅ΡΡΠΎΡ β ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½Ρ ΠΌΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΈΠ·Π°
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ ΡΠ»ΠΎΠ²Π°ΡΡ
ΠΠΎΡΡΠΎΠ»ΠΎΠ³ΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·Π°ΡΠΎΡ
ΠΠ΅ΠΌΠΌΠ°ΡΠΈΠ·Π°ΡΠΈΡ
Π£ ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ ΡΠ»ΠΎΠ²Π° Π΅ΡΡΡ Π»Π΅ΠΌΠΌΠ° (Π½ΠΎΡΠΌΠ°Π»ΡΠ½Π°Ρ ΡΠΎΡΠΌΠ°):
ΠΊΠΎΡΠΊΠ΅, ΠΊΠΎΡΠΊΡ, ΠΊΠΎΡΠΊΠ°ΠΌ, ΠΊΠΎΡΠΊΠΎΠΉ ΠΊΠΎΡΠΊΠ°
Π±Π΅ΠΆΠ°Π», Π±Π΅ΠΆΠΈΡ, Π±Π΅Π³Ρ Π±Π΅ΠΆΠ°ΡΡ
Π±Π΅Π»ΠΎΠΌΡ, Π±Π΅Π»ΡΠΌ, Π±Π΅Π»ΡΠΌΠΈ Π±Π΅Π»ΡΠΉ
Π‘ΡΠ΅ΠΌΠΌΠΈΠ½Π³
Π‘Π»ΠΎΠ²Π° ΡΠΎΡΡΠΎΡΡ ΠΈΠ· ΠΌΠΎΡΡΠ΅ΠΌ: . Π‘ΡΠ΅ΠΌΠΌΠΈΠ½Π³ ΠΏΠΎΠ·Π²ΠΎΠ»ΡΠ΅Ρ ΠΎΡΠ±ΡΠΎΡΠΈΡΡ Π°ΡΡΠΈΠΊΡΡ. Π§Π°ΡΠ΅ Π²ΡΠ΅Π³ΠΎ ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΠ΅ΡΡΡ Π°Π»Π³ΠΎΡΠΈΡΠΌ ΠΠΎΡΡΠ΅ΡΠ°.
1-ΡΠΉ Π²ΠΈΠ΄ ΠΎΡΠΈΠ±ΠΊΠΈ: Π±Π΅Π»ΡΠΉ, Π±Π΅Π»ΠΊΠ°, Π±Π΅Π»ΡΠ΅ Π±Π΅Π»
2-ΠΎΠΉ Π²ΠΈΠ΄ ΠΎΡΠΈΠ±ΠΊΠΈ: ΡΡΡΠ΄Π½ΠΎΡΡΡ, ΡΡΡΠ΄Π½ΡΠΉ ΡΡΡΠ΄Π½ΠΎΡΡ, ΡΡΡΠ΄
3-ΠΈΠΉ Π²ΠΈΠ΄ ΠΎΡΠΈΠ±ΠΊΠΈ: Π±ΡΡΡΡΡΠΉ, Π±ΡΡΡΡΠ΅Π΅ Π±ΡΡΡ, ΠΏΠΎΠ±ΡΡΡΡΠ΅Π΅ ΠΏΠΎΠ±ΡΡΡ
ΠΠ»Π³ΠΎΡΠΈΡΠΌ ΠΠΎΡΡΠ΅ΡΠ° ΡΠΎΡΡΠΎΠΈΡ ΠΈΠ· 5 ΡΠΈΠΊΠ»ΠΎΠ² ΠΊΠΎΠΌΠ°Π½Π΄, Π½Π° ΠΊΠ°ΠΆΠ΄ΠΎΠΌ ΡΠΈΠΊΠ»Π΅ β ΠΎΠΏΠ΅ΡΠ°ΡΠΈΡ ΡΠ΄Π°Π»Π΅Π½ΠΈΡ / Π·Π°ΠΌΠ΅Π½Ρ ΡΡΡΡΠΈΠΊΡΠ°. ΠΠΎΠ·ΠΌΠΎΠΆΠ½Ρ Π²Π΅ΡΠΎΡΡΠ½ΠΎΡΡΠ½ΡΠ΅ ΡΠ°ΡΡΠΈΡΠ΅Π½ΠΈΡ Π°Π»Π³ΠΎΡΠΈΡΠΌΠ°.
Π Π°Π·Π±ΠΎΡ ΡΠ»ΠΎΠ²Π°
ΠΠ°Π΄Π°Π½ΠΈΠ΅ 4
ΠΠ°ΠΉΠ΄ΠΈΡΠ΅ Π² ΡΠΏΠΈΡΠΊΠ΅ ΠΏΠ΅ΡΡΠΎΠ½Π°ΠΆΠ΅ΠΉ ΡΠΎΠΌΠ°Π½Π° "ΠΠΎΠΉΠ½Π° ΠΈ ΠΌΠΈΡ" (task4.txt) Π²ΡΠ΅ ΡΠ½ΠΈΠΊΠ°Π»ΡΠ½ΡΠ΅ ΠΆΠ΅Π½ΡΠΊΠΈΠ΅ ΠΈΠΌΠ΅Π½Π°.
ΠΠ΅ΡΠ²ΠΈΡΠ½Π°Ρ ΠΎΠ±ΡΠ°Π±ΠΎΡΠΊΠ° ΡΠ΅ΠΊΡΡΠΎΠ²
Π£Π΄Π°Π»Π΅Π½ΠΈΠ΅ ΡΡΠΎΠΏ-ΡΠ»ΠΎΠ²
Π‘ΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΈΠΉ Π°Π½Π°Π»ΠΈΠ·
ΠΡΠ°ΠΌΠΌΠ°ΡΠΈΠΊΠ° Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡΠ΅ΠΉ
Π― ΠΊΡΠΏΠΈΠ» ΠΊΠΎΡΠ΅ Π² Π±ΠΎΠ»ΡΡΠΎΠΌ ΠΌΠ°Π³Π°Π·ΠΈΠ½Π΅
ΠΡΠ΅ ΡΠ»ΠΎΠ²Π° Π² ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΈ ΡΠ²ΡΠ·Π°Π½Ρ ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΠ΅ΠΌ ΡΠΈΠΏΠ° "Ρ ΠΎΠ·ΡΠΈΠ½-ΡΠ»ΡΠ³Π°", ΠΈΠΌΠ΅ΡΡΠΈΠΌ ΡΠ°Π·Π»ΠΈΡΠ½ΡΠ΅ ΠΏΠΎΠ΄ΡΠΈΠΏΡ
Π£Π·Π΅Π» Π΄Π΅ΡΠ΅Π²Π° β ΡΠ»ΠΎΠ²ΠΎ Π² ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΠΈ
ΠΡΠ³Π° Π΄Π΅ΡΠ΅Π²Π° β ΠΎΡΠ½ΠΎΡΠ΅Π½ΠΈΠ΅ ΠΏΠΎΠ΄ΡΠΈΠ½Π΅Π½ΠΈΡ
SyntaxNet
SyntaxNet β Π°ΡΡ ΠΈΡΠ΅ΠΊΡΡΡΠ° ΡΠΈΠ½ΡΠ°ΠΊΡΠΈΡΠ΅ΡΠΊΠΎΠ³ΠΎ ΠΏΠ°ΡΡΠ΅ΡΠ°. ΠΠΎΡΡΡΠΏΠ½Ρ ΠΎΠ±ΡΡΠ΅Π½Π½ΡΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄Π»Ρ Π±ΠΎΠ»Π΅Π΅ ΡΠ΅ΠΌ 40 ΡΠ·ΡΠΊΠΎΠ², Π² ΡΠΎΠΌ ΡΠΈΡΠ»Π΅, Π΄Π»Ρ ΡΡΡΡΠΊΠΎΠ³ΠΎ.
D. Chen and C. D. Manning. A Fast and Accurate Dependency Parser using Neural Networks. EMNLP. 2014.
Π’ΡΠΎΠΉΠΊΠΈ ΡΡΠ±ΡΠ΅ΠΊΡ-ΠΎΠ±ΡΠ΅ΠΊΡ-Π³Π»Π°Π³ΠΎΠ»:
ΠΠ°Π΄Π°Π½ΠΈΠ΅ 5
ΠΠ·ΠΌΠ΅Π½ΠΈΡΠ΅ ΠΊΠΎΠ΄ Π²ΡΡΠ΅ ΡΠ°ΠΊ, ΡΡΠΎΠ±Ρ ΡΡΠΈΡΡΠ²Π°Π»ΠΈΡΡ: 1. ΠΠ΄Π½ΠΎΡΠΎΠ΄Π½ΡΠ΅ ΡΠ»Π΅Π½Ρ ΠΏΡΠ΅Π΄Π»ΠΎΠΆΠ΅Π½ΠΈΡ * (ΠΏΠ°ΡΠΊ, ΠΏΠ»ΠΎΡΠ°Π΄ΠΊΠ°), (ΠΠ΅ΡΠΌΠ°Π½ΠΈΡ, Π©Π²Π΅ΠΉΡΠ°ΡΠΈΡ) 2. Π‘Π»ΠΎΠΆΠ½ΡΠ΅ ΡΠΊΠ°Π·ΡΠ΅ΠΌΡΠ΅ * (Π½Π°ΡΠ½Π΅Ρ ΠΏΡΠΎΠ΄Π°Π²Π°ΡΡ), (Π·Π°ΠΏΡΠ΅ΡΠΈΠ» ΠΏΡΠΎΠ²ΠΎΠ·ΠΈΡΡ) 3. ΠΠ΅ΠΏΡΡΠΌΡΠ΅ ΠΎΠ±ΡΠ΅ΠΊΡΡ * (Π΅Π΄Π΅Ρ, ΠΠΎΠ»ΡΡΡ), (ΡΠΏΠ΅Π», ΡΠΊΠ°Π½Π΄Π°Π»Π΅)