1714 lines
18 KiB
JSON
1714 lines
18 KiB
JSON
[
|
|
"\t",
|
|
"\n",
|
|
" ",
|
|
" ",
|
|
"\"",
|
|
"'",
|
|
"''",
|
|
"'-(",
|
|
"'-)",
|
|
"'Cause",
|
|
"'Cos",
|
|
"'Coz",
|
|
"'Cuz",
|
|
"'S",
|
|
"'X",
|
|
"'Xxx",
|
|
"'Xxxxx",
|
|
"'am",
|
|
"'bout",
|
|
"'cause",
|
|
"'cos",
|
|
"'coz",
|
|
"'cuz",
|
|
"'d",
|
|
"'em",
|
|
"'ll",
|
|
"'m",
|
|
"'nuff",
|
|
"'re",
|
|
"'s",
|
|
"'ve",
|
|
"'x",
|
|
"'xx",
|
|
"'xxx",
|
|
"'xxxx",
|
|
"'y",
|
|
"(",
|
|
"(((",
|
|
"(*>",
|
|
"(*_*)",
|
|
"(-8",
|
|
"(-:",
|
|
"(-;",
|
|
"(-_-)",
|
|
"(-d",
|
|
"(._.)",
|
|
"(:",
|
|
"(;",
|
|
"(=",
|
|
"(>_<)",
|
|
"(^_^)",
|
|
"(o:",
|
|
"(x:",
|
|
"(x_x)",
|
|
"(\u00ac_\u00ac)",
|
|
"(\u0ca0_\u0ca0)",
|
|
"(\u256f\u00b0\u25a1\u00b0\uff09\u256f\ufe35\u253b\u2501\u253b",
|
|
")",
|
|
")))",
|
|
")-:",
|
|
")/\u00af",
|
|
"):",
|
|
"*",
|
|
",",
|
|
"-",
|
|
"-((",
|
|
"-))",
|
|
"-/",
|
|
"-0",
|
|
"-3",
|
|
"-8",
|
|
"-D",
|
|
"-O",
|
|
"-P",
|
|
"-X",
|
|
"-_-",
|
|
"-__-",
|
|
"-d",
|
|
"-o",
|
|
"-p",
|
|
"-x",
|
|
"-|",
|
|
".",
|
|
".C.",
|
|
".D.",
|
|
".E.",
|
|
".G.",
|
|
".H.",
|
|
".J.",
|
|
".M.",
|
|
".Y.",
|
|
"._.",
|
|
".e.",
|
|
".g.",
|
|
".m.",
|
|
".s.",
|
|
"/",
|
|
"/3",
|
|
"/d",
|
|
"/or",
|
|
"0",
|
|
"0.0",
|
|
"0.o",
|
|
"001",
|
|
"010",
|
|
"015",
|
|
"016",
|
|
"017",
|
|
"018",
|
|
"019",
|
|
"023",
|
|
"0_0",
|
|
"0_o",
|
|
"1",
|
|
"10",
|
|
"10a.m",
|
|
"10a.m.",
|
|
"10p.m",
|
|
"10p.m.",
|
|
"11",
|
|
"11a.m",
|
|
"11a.m.",
|
|
"11p.m",
|
|
"11p.m.",
|
|
"12",
|
|
"12a.m",
|
|
"12a.m.",
|
|
"12p.m",
|
|
"12p.m.",
|
|
"15/10/2023",
|
|
"19",
|
|
"1a.m",
|
|
"1a.m.",
|
|
"1p.m",
|
|
"1p.m.",
|
|
"2",
|
|
"2001",
|
|
"2010",
|
|
"2015",
|
|
"2016",
|
|
"2017",
|
|
"2018",
|
|
"2019",
|
|
"2a.m",
|
|
"2a.m.",
|
|
"2p.m",
|
|
"2p.m.",
|
|
"3",
|
|
"33",
|
|
"333",
|
|
"3a.m",
|
|
"3a.m.",
|
|
"3p.m",
|
|
"3p.m.",
|
|
"4",
|
|
"4a.m",
|
|
"4a.m.",
|
|
"4p.m",
|
|
"4p.m.",
|
|
"5",
|
|
"5a.m",
|
|
"5a.m.",
|
|
"5p.m",
|
|
"5p.m.",
|
|
"5th",
|
|
"6",
|
|
"6a.m",
|
|
"6a.m.",
|
|
"6p.m",
|
|
"6p.m.",
|
|
"7",
|
|
"7a.m",
|
|
"7a.m.",
|
|
"7p.m",
|
|
"7p.m.",
|
|
"8",
|
|
"8)",
|
|
"8-",
|
|
"8-)",
|
|
"8-D",
|
|
"8-d",
|
|
"8D",
|
|
"8a.m",
|
|
"8a.m.",
|
|
"8d",
|
|
"8p.m",
|
|
"8p.m.",
|
|
"8th",
|
|
"9",
|
|
"9a.m",
|
|
"9a.m.",
|
|
"9p.m",
|
|
"9p.m.",
|
|
":",
|
|
":'(",
|
|
":')",
|
|
":'-(",
|
|
":'-)",
|
|
":(",
|
|
":((",
|
|
":(((",
|
|
":()",
|
|
":)",
|
|
":))",
|
|
":)))",
|
|
":*",
|
|
":-(",
|
|
":-((",
|
|
":-(((",
|
|
":-)",
|
|
":-))",
|
|
":-)))",
|
|
":-*",
|
|
":-/",
|
|
":-0",
|
|
":-3",
|
|
":->",
|
|
":-D",
|
|
":-O",
|
|
":-P",
|
|
":-X",
|
|
":-]",
|
|
":-d",
|
|
":-o",
|
|
":-p",
|
|
":-x",
|
|
":-|",
|
|
":-}",
|
|
":/",
|
|
":0",
|
|
":1",
|
|
":3",
|
|
":>",
|
|
":D",
|
|
":O",
|
|
":P",
|
|
":X",
|
|
":]",
|
|
":d",
|
|
":o",
|
|
":o)",
|
|
":p",
|
|
":x",
|
|
":x)",
|
|
":|",
|
|
":}",
|
|
":\u2019(",
|
|
":\u2019)",
|
|
":\u2019-(",
|
|
":\u2019-)",
|
|
";",
|
|
";)",
|
|
";-)",
|
|
";-D",
|
|
";-X",
|
|
";-d",
|
|
";D",
|
|
";X",
|
|
";_;",
|
|
";d",
|
|
"<",
|
|
"<.<",
|
|
"</3",
|
|
"</d",
|
|
"<3",
|
|
"<33",
|
|
"<333",
|
|
"<d",
|
|
"<dd",
|
|
"<ddd",
|
|
"<space>",
|
|
"<xxxx>",
|
|
"=",
|
|
"=(",
|
|
"=)",
|
|
"=/",
|
|
"=3",
|
|
"=D",
|
|
"=X",
|
|
"=[",
|
|
"=]",
|
|
"=d",
|
|
"=|",
|
|
">",
|
|
">.<",
|
|
">.>",
|
|
">:(",
|
|
">:o",
|
|
">:x",
|
|
"><(((*>",
|
|
"?",
|
|
"@",
|
|
"@_@",
|
|
"A",
|
|
"AI",
|
|
"ATE",
|
|
"AUTHOR",
|
|
"Adm",
|
|
"Adm.",
|
|
"Ai",
|
|
"Ak",
|
|
"Ak.",
|
|
"Ala",
|
|
"Ala.",
|
|
"Alabama",
|
|
"Alaska",
|
|
"Apr",
|
|
"Apr.",
|
|
"April",
|
|
"Are",
|
|
"Ariz",
|
|
"Ariz.",
|
|
"Arizona",
|
|
"Ark",
|
|
"Ark.",
|
|
"Arkansas",
|
|
"Aug",
|
|
"Aug.",
|
|
"August",
|
|
"B",
|
|
"Bros",
|
|
"Bros.",
|
|
"C",
|
|
"C'm",
|
|
"C++",
|
|
"C.",
|
|
"Ca",
|
|
"Calif",
|
|
"Calif.",
|
|
"California",
|
|
"Can",
|
|
"Cause",
|
|
"Co",
|
|
"Co.",
|
|
"Colo",
|
|
"Colo.",
|
|
"Colorado",
|
|
"Conn",
|
|
"Conn.",
|
|
"Connecticut",
|
|
"Corp",
|
|
"Corp.",
|
|
"Cos",
|
|
"Could",
|
|
"Coz",
|
|
"Cuz",
|
|
"C\u2019m",
|
|
"D",
|
|
"D.",
|
|
"D.C.",
|
|
"DNA",
|
|
"Dare",
|
|
"Dec",
|
|
"Dec.",
|
|
"December",
|
|
"Del",
|
|
"Del.",
|
|
"Delaware",
|
|
"Did",
|
|
"Do",
|
|
"Does",
|
|
"Doin",
|
|
"Doin'",
|
|
"Doin\u2019",
|
|
"Dr",
|
|
"Dr.",
|
|
"E",
|
|
"E.G.",
|
|
"E.g",
|
|
"E.g.",
|
|
"F",
|
|
"F.",
|
|
"Feb",
|
|
"Feb.",
|
|
"February",
|
|
"Fla",
|
|
"Fla.",
|
|
"Florida",
|
|
"G",
|
|
"Ga",
|
|
"Ga.",
|
|
"Gen",
|
|
"Gen.",
|
|
"Georgia",
|
|
"Goin",
|
|
"Goin'",
|
|
"Goin\u2019",
|
|
"Gon",
|
|
"Got",
|
|
"Gov",
|
|
"Gov.",
|
|
"H",
|
|
"HOR",
|
|
"Had",
|
|
"Has",
|
|
"Have",
|
|
"Havin",
|
|
"Havin'",
|
|
"Havin\u2019",
|
|
"He",
|
|
"He's",
|
|
"He\u2019s",
|
|
"How",
|
|
"How's",
|
|
"How\u2019s",
|
|
"I",
|
|
"I.E.",
|
|
"I.e",
|
|
"I.e.",
|
|
"Ia",
|
|
"Ia.",
|
|
"Id",
|
|
"Id.",
|
|
"Idaho",
|
|
"Ill",
|
|
"Ill.",
|
|
"Illinois",
|
|
"Inc",
|
|
"Inc.",
|
|
"Ind",
|
|
"Ind.",
|
|
"Indiana",
|
|
"Iowa",
|
|
"Is",
|
|
"It",
|
|
"It's",
|
|
"It\u2019s",
|
|
"J",
|
|
"Jan",
|
|
"Jan.",
|
|
"January",
|
|
"Jr",
|
|
"Jr.",
|
|
"Jul",
|
|
"Jul.",
|
|
"July",
|
|
"Jun",
|
|
"Jun.",
|
|
"June",
|
|
"K",
|
|
"K.",
|
|
"Kan",
|
|
"Kan.",
|
|
"Kans",
|
|
"Kans.",
|
|
"Kansas",
|
|
"Kentucky",
|
|
"Ky",
|
|
"Ky.",
|
|
"L",
|
|
"LHF",
|
|
"La",
|
|
"La.",
|
|
"Let",
|
|
"Let's",
|
|
"Let\u2019s",
|
|
"Louisiana",
|
|
"Lovin",
|
|
"Lovin'",
|
|
"Lovin\u2019",
|
|
"Ltd",
|
|
"Ltd.",
|
|
"M",
|
|
"Ma'am",
|
|
"Mar",
|
|
"Mar.",
|
|
"March",
|
|
"Mass",
|
|
"Mass.",
|
|
"Massachusetts",
|
|
"May",
|
|
"Ma\u2019am",
|
|
"Md",
|
|
"Md.",
|
|
"Messrs",
|
|
"Messrs.",
|
|
"Mich",
|
|
"Mich.",
|
|
"Michigan",
|
|
"Might",
|
|
"Minn",
|
|
"Minn.",
|
|
"Minnesota",
|
|
"Miss",
|
|
"Miss.",
|
|
"Mississippi",
|
|
"Mo",
|
|
"Mo.",
|
|
"Mont",
|
|
"Mont.",
|
|
"Mount",
|
|
"Mr",
|
|
"Mr.",
|
|
"Mrs",
|
|
"Mrs.",
|
|
"Ms",
|
|
"Ms.",
|
|
"Mt",
|
|
"Mt.",
|
|
"Must",
|
|
"N",
|
|
"N.C.",
|
|
"N.D.",
|
|
"N.H.",
|
|
"N.J.",
|
|
"N.M.",
|
|
"N.Y.",
|
|
"NET",
|
|
"NLU",
|
|
"Neb",
|
|
"Neb.",
|
|
"Nebr",
|
|
"Nebr.",
|
|
"Nebraska",
|
|
"Need",
|
|
"Nev",
|
|
"Nev.",
|
|
"Nevada",
|
|
"New Hampshire",
|
|
"New Jersey",
|
|
"New Mexico",
|
|
"New York",
|
|
"North Carolina",
|
|
"North Dakota",
|
|
"Not",
|
|
"Nothin",
|
|
"Nothin'",
|
|
"Nothin\u2019",
|
|
"Nov",
|
|
"Nov.",
|
|
"November",
|
|
"Nuthin",
|
|
"Nuthin'",
|
|
"Nuthin\u2019",
|
|
"O",
|
|
"O'clock",
|
|
"O.O",
|
|
"O.o",
|
|
"O_O",
|
|
"O_o",
|
|
"Oct",
|
|
"Oct.",
|
|
"October",
|
|
"Okla",
|
|
"Okla.",
|
|
"Oklahoma",
|
|
"Ol",
|
|
"Ol'",
|
|
"Ol\u2019",
|
|
"Ore",
|
|
"Ore.",
|
|
"Oregon",
|
|
"Ought",
|
|
"O\u2019clock",
|
|
"P",
|
|
"PIC",
|
|
"Pa",
|
|
"Pa.",
|
|
"Pennsylvania",
|
|
"Ph",
|
|
"Ph.D.",
|
|
"Prof",
|
|
"Prof.",
|
|
"Q",
|
|
"QA",
|
|
"R",
|
|
"RC",
|
|
"RLHF",
|
|
"ROOT",
|
|
"Rep",
|
|
"Rep.",
|
|
"Rev",
|
|
"Rev.",
|
|
"S",
|
|
"S.C.",
|
|
"SQUAD",
|
|
"Sen",
|
|
"Sen.",
|
|
"Sep",
|
|
"Sep.",
|
|
"Sept",
|
|
"Sept.",
|
|
"September",
|
|
"Sha",
|
|
"She",
|
|
"She's",
|
|
"She\u2019s",
|
|
"Should",
|
|
"Siddhant",
|
|
"Singh",
|
|
"Somethin",
|
|
"Somethin'",
|
|
"Somethin\u2019",
|
|
"South Carolina",
|
|
"St",
|
|
"St.",
|
|
"T",
|
|
"TITLE",
|
|
"TLE",
|
|
"TOPIC",
|
|
"Tenn",
|
|
"Tenn.",
|
|
"Tennessee",
|
|
"That",
|
|
"That's",
|
|
"That\u2019s",
|
|
"There",
|
|
"There's",
|
|
"There\u2019s",
|
|
"These",
|
|
"They",
|
|
"This",
|
|
"This's",
|
|
"This\u2019s",
|
|
"Those",
|
|
"UAD",
|
|
"V",
|
|
"V.V",
|
|
"V_V",
|
|
"Va",
|
|
"Va.",
|
|
"Virginia",
|
|
"W",
|
|
"Was",
|
|
"Wash",
|
|
"Wash.",
|
|
"Washington",
|
|
"We",
|
|
"Were",
|
|
"What",
|
|
"What's",
|
|
"What\u2019s",
|
|
"When",
|
|
"When's",
|
|
"When\u2019s",
|
|
"Where",
|
|
"Where's",
|
|
"Where\u2019s",
|
|
"Who",
|
|
"Who's",
|
|
"Who\u2019s",
|
|
"Why",
|
|
"Why's",
|
|
"Why\u2019s",
|
|
"Wis",
|
|
"Wis.",
|
|
"Wisconsin",
|
|
"Wo",
|
|
"Would",
|
|
"X'x",
|
|
"X'xxxx",
|
|
"X++",
|
|
"X.",
|
|
"X.X",
|
|
"X.X.",
|
|
"X.x",
|
|
"X.x.",
|
|
"XD",
|
|
"XDD",
|
|
"XX",
|
|
"XXX",
|
|
"XXXX",
|
|
"X_X",
|
|
"X_x",
|
|
"Xx",
|
|
"Xx'",
|
|
"Xx'x",
|
|
"Xx'xx",
|
|
"Xx.",
|
|
"Xx.X.",
|
|
"Xxx",
|
|
"Xxx'x",
|
|
"Xxx.",
|
|
"Xxxx",
|
|
"Xxxx'",
|
|
"Xxxx'x",
|
|
"Xxxx.",
|
|
"Xxxxx",
|
|
"Xxxxx'",
|
|
"Xxxxx'x",
|
|
"Xxxxx.",
|
|
"Xxxxx\u2019",
|
|
"Xxxxx\u2019x",
|
|
"Xxxx\u2019",
|
|
"Xxxx\u2019x",
|
|
"Xxx\u2019x",
|
|
"Xx\u2019",
|
|
"Xx\u2019x",
|
|
"Xx\u2019xx",
|
|
"X\u2019x",
|
|
"X\u2019xxxx",
|
|
"Y",
|
|
"You",
|
|
"[",
|
|
"[-:",
|
|
"[:",
|
|
"[=",
|
|
"\\",
|
|
"\\\")",
|
|
"\\n",
|
|
"\\t",
|
|
"\\x",
|
|
"]",
|
|
"]=",
|
|
"^",
|
|
"^_^",
|
|
"^__^",
|
|
"^___^",
|
|
"_*)",
|
|
"_-)",
|
|
"_.)",
|
|
"_<)",
|
|
"_^)",
|
|
"__-",
|
|
"__^",
|
|
"_\u00ac)",
|
|
"_\u0ca0)",
|
|
"a",
|
|
"a.",
|
|
"a.m",
|
|
"a.m.",
|
|
"aQA",
|
|
"about",
|
|
"ace",
|
|
"ack",
|
|
"adm",
|
|
"adm.",
|
|
"advances",
|
|
"africa",
|
|
"after",
|
|
"against",
|
|
"age",
|
|
"aging",
|
|
"ago",
|
|
"ahmed",
|
|
"ai",
|
|
"ai3",
|
|
"ain",
|
|
"ak",
|
|
"ak.",
|
|
"ala",
|
|
"ala.",
|
|
"alexnet",
|
|
"all",
|
|
"am",
|
|
"amount",
|
|
"amr",
|
|
"an",
|
|
"an.",
|
|
"and",
|
|
"and/or",
|
|
"andrea",
|
|
"ans",
|
|
"ant",
|
|
"any",
|
|
"approaches",
|
|
"apr",
|
|
"apr.",
|
|
"aqa",
|
|
"ar.",
|
|
"are",
|
|
"ariz",
|
|
"ariz.",
|
|
"ark",
|
|
"ark.",
|
|
"art",
|
|
"articles",
|
|
"ary",
|
|
"as",
|
|
"asa",
|
|
"ase",
|
|
"ash",
|
|
"asia",
|
|
"ass",
|
|
"ast",
|
|
"ata",
|
|
"ate",
|
|
"aug",
|
|
"aug.",
|
|
"augmented",
|
|
"author",
|
|
"authored",
|
|
"ave",
|
|
"ays",
|
|
"b",
|
|
"b.",
|
|
"bal",
|
|
"based",
|
|
"because",
|
|
"before",
|
|
"behavior",
|
|
"being",
|
|
"benchmark",
|
|
"benchmarks",
|
|
"ber",
|
|
"best",
|
|
"between",
|
|
"biodiversity",
|
|
"bob",
|
|
"books",
|
|
"bot",
|
|
"bout",
|
|
"br.",
|
|
"brain",
|
|
"bros",
|
|
"bros.",
|
|
"build",
|
|
"building",
|
|
"by",
|
|
"c",
|
|
"c'm",
|
|
"c++",
|
|
"c.",
|
|
"ca",
|
|
"cal",
|
|
"calif",
|
|
"calif.",
|
|
"can",
|
|
"cancer",
|
|
"candela",
|
|
"canrad",
|
|
"cat",
|
|
"cause",
|
|
"cay",
|
|
"ce>",
|
|
"cer",
|
|
"ces",
|
|
"ch.",
|
|
"chatbot",
|
|
"chromosomes",
|
|
"classification",
|
|
"cloud",
|
|
"co",
|
|
"co.",
|
|
"coco",
|
|
"collection",
|
|
"colo",
|
|
"colo.",
|
|
"come",
|
|
"compilers",
|
|
"comprehensive",
|
|
"computing",
|
|
"concering",
|
|
"concerning",
|
|
"conduct",
|
|
"conll5",
|
|
"conn",
|
|
"conn.",
|
|
"content",
|
|
"contents",
|
|
"convai3",
|
|
"conversational",
|
|
"convolutional",
|
|
"corp",
|
|
"corp.",
|
|
"correlation",
|
|
"cos",
|
|
"could",
|
|
"covid",
|
|
"coz",
|
|
"ct.",
|
|
"cts",
|
|
"current",
|
|
"cuz",
|
|
"c\u2019m",
|
|
"d",
|
|
"d)",
|
|
"d-",
|
|
"d-)",
|
|
"d-X",
|
|
"d.",
|
|
"d.c.",
|
|
"d.d",
|
|
"d.x",
|
|
"dX",
|
|
"d_d",
|
|
"d_x",
|
|
"dare",
|
|
"data",
|
|
"dataset",
|
|
"datasets",
|
|
"date",
|
|
"days",
|
|
"dd",
|
|
"dd/dd/dddd",
|
|
"ddd",
|
|
"dddd",
|
|
"ddx.x",
|
|
"ddx.x.",
|
|
"dec",
|
|
"dec.",
|
|
"decay",
|
|
"del",
|
|
"del.",
|
|
"detection",
|
|
"dia",
|
|
"diabetes",
|
|
"dialogue",
|
|
"did",
|
|
"discussed",
|
|
"discussing",
|
|
"disease",
|
|
"diseases",
|
|
"disposition",
|
|
"diversity",
|
|
"dm.",
|
|
"dna",
|
|
"do",
|
|
"does",
|
|
"doin",
|
|
"doin'",
|
|
"doing",
|
|
"doin\u2019",
|
|
"dr",
|
|
"dr.",
|
|
"drawings",
|
|
"dx.x",
|
|
"dx.x.",
|
|
"dxx",
|
|
"e",
|
|
"e's",
|
|
"e.",
|
|
"e.g",
|
|
"e.g.",
|
|
"ead",
|
|
"eat",
|
|
"eb.",
|
|
"ebr",
|
|
"ec.",
|
|
"ece",
|
|
"ecological",
|
|
"ecommerce",
|
|
"economic",
|
|
"ecosystem",
|
|
"ect",
|
|
"eed",
|
|
"een",
|
|
"eep",
|
|
"effect",
|
|
"effects",
|
|
"el.",
|
|
"ela",
|
|
"elp",
|
|
"els",
|
|
"ely",
|
|
"em",
|
|
"empirical",
|
|
"empirically",
|
|
"ems",
|
|
"en",
|
|
"en.",
|
|
"engines",
|
|
"enn",
|
|
"enough",
|
|
"ent",
|
|
"entities",
|
|
"ep.",
|
|
"ept",
|
|
"ere",
|
|
"ern",
|
|
"ers",
|
|
"ese",
|
|
"ess",
|
|
"est",
|
|
"ets",
|
|
"ev.",
|
|
"evaluate",
|
|
"examine",
|
|
"exisiting",
|
|
"explaining",
|
|
"explains",
|
|
"e\u2019s",
|
|
"f",
|
|
"f.",
|
|
"face",
|
|
"farmchat",
|
|
"feb",
|
|
"feb.",
|
|
"feedback",
|
|
"fic",
|
|
"find",
|
|
"finding",
|
|
"fla",
|
|
"fla.",
|
|
"for",
|
|
"from",
|
|
"g",
|
|
"g.",
|
|
"ga",
|
|
"ga.",
|
|
"ged",
|
|
"gen",
|
|
"gen.",
|
|
"generate",
|
|
"generation",
|
|
"generative",
|
|
"genetic",
|
|
"genetics",
|
|
"ger",
|
|
"get",
|
|
"ght",
|
|
"ghy",
|
|
"give",
|
|
"global",
|
|
"goin",
|
|
"goin'",
|
|
"going",
|
|
"goin\u2019",
|
|
"gon",
|
|
"gonna",
|
|
"good",
|
|
"got",
|
|
"gouhar",
|
|
"gov",
|
|
"gov.",
|
|
"gue",
|
|
"h",
|
|
"h.",
|
|
"had",
|
|
"happiness",
|
|
"har",
|
|
"has",
|
|
"hat",
|
|
"have",
|
|
"havin",
|
|
"havin'",
|
|
"having",
|
|
"havin\u2019",
|
|
"he",
|
|
"he's",
|
|
"heart",
|
|
"hed",
|
|
"help",
|
|
"hen",
|
|
"her",
|
|
"hes",
|
|
"hey",
|
|
"he\u2019s",
|
|
"hin",
|
|
"hip",
|
|
"his",
|
|
"hostager",
|
|
"how",
|
|
"how's",
|
|
"how\u2019s",
|
|
"human",
|
|
"i",
|
|
"i.",
|
|
"i.e",
|
|
"i.e.",
|
|
"ia",
|
|
"ia.",
|
|
"ica",
|
|
"ich",
|
|
"ics",
|
|
"id",
|
|
"id.",
|
|
"ies",
|
|
"iew",
|
|
"if.",
|
|
"ife",
|
|
"ild",
|
|
"ill",
|
|
"ill.",
|
|
"ils",
|
|
"image",
|
|
"imageNET",
|
|
"imagenet",
|
|
"ime",
|
|
"important",
|
|
"in",
|
|
"in'",
|
|
"inc",
|
|
"inc.",
|
|
"ind",
|
|
"ind.",
|
|
"india",
|
|
"ine",
|
|
"information",
|
|
"ing",
|
|
"ink",
|
|
"inn",
|
|
"ins",
|
|
"intelligence",
|
|
"intent",
|
|
"intents",
|
|
"interested",
|
|
"introduction",
|
|
"in\u2019",
|
|
"ion",
|
|
"ior",
|
|
"is",
|
|
"is.",
|
|
"isa",
|
|
"isabella",
|
|
"iss",
|
|
"it",
|
|
"it's",
|
|
"ite",
|
|
"ity",
|
|
"it\u2019s",
|
|
"ive",
|
|
"iz.",
|
|
"ize",
|
|
"j",
|
|
"j.",
|
|
"jack",
|
|
"jan",
|
|
"jan.",
|
|
"janet",
|
|
"jr",
|
|
"jr.",
|
|
"jul",
|
|
"jul.",
|
|
"july",
|
|
"jun",
|
|
"jun.",
|
|
"k",
|
|
"k.",
|
|
"kan",
|
|
"kan.",
|
|
"kans",
|
|
"kans.",
|
|
"kidney",
|
|
"kla",
|
|
"know",
|
|
"ky",
|
|
"ky.",
|
|
"l",
|
|
"l.",
|
|
"la",
|
|
"la.",
|
|
"language",
|
|
"large",
|
|
"last",
|
|
"lately",
|
|
"latest",
|
|
"learning",
|
|
"led",
|
|
"leonardo",
|
|
"les",
|
|
"let",
|
|
"let's",
|
|
"let\u2019s",
|
|
"levels",
|
|
"lhf",
|
|
"lif",
|
|
"life",
|
|
"link",
|
|
"literature",
|
|
"living",
|
|
"ll",
|
|
"ll.",
|
|
"ll5",
|
|
"lla",
|
|
"llt",
|
|
"lly",
|
|
"lo.",
|
|
"looking",
|
|
"lovin",
|
|
"lovin'",
|
|
"loving",
|
|
"lovin\u2019",
|
|
"ltd",
|
|
"ltd.",
|
|
"m",
|
|
"m.",
|
|
"ma'am",
|
|
"machines",
|
|
"madam",
|
|
"man",
|
|
"mar",
|
|
"mar.",
|
|
"march",
|
|
"marco",
|
|
"marine",
|
|
"mass",
|
|
"mass.",
|
|
"may",
|
|
"maybe",
|
|
"ma\u2019am",
|
|
"md",
|
|
"md.",
|
|
"me",
|
|
"med",
|
|
"medulla",
|
|
"mer",
|
|
"mes",
|
|
"messrs",
|
|
"messrs.",
|
|
"methods",
|
|
"mic",
|
|
"mich",
|
|
"mich.",
|
|
"might",
|
|
"minn",
|
|
"minn.",
|
|
"miss",
|
|
"miss.",
|
|
"mnl",
|
|
"mo",
|
|
"mo.",
|
|
"model",
|
|
"models",
|
|
"modern",
|
|
"mont",
|
|
"mont.",
|
|
"month",
|
|
"mor",
|
|
"most",
|
|
"mr",
|
|
"mr.",
|
|
"mrs",
|
|
"mrs.",
|
|
"ms",
|
|
"ms.",
|
|
"mt",
|
|
"mt.",
|
|
"music",
|
|
"must",
|
|
"my",
|
|
"n",
|
|
"n's",
|
|
"n't",
|
|
"n.",
|
|
"n.c.",
|
|
"n.d.",
|
|
"n.h.",
|
|
"n.j.",
|
|
"n.m.",
|
|
"n.y.",
|
|
"na",
|
|
"nai",
|
|
"nal",
|
|
"nasa",
|
|
"nc.",
|
|
"nce",
|
|
"nd.",
|
|
"nds",
|
|
"neb",
|
|
"neb.",
|
|
"nebr",
|
|
"nebr.",
|
|
"need",
|
|
"nes",
|
|
"net",
|
|
"netrworks",
|
|
"networks",
|
|
"neural",
|
|
"nev",
|
|
"nev.",
|
|
"ney",
|
|
"ngh",
|
|
"ngs",
|
|
"nia",
|
|
"nils",
|
|
"nlu",
|
|
"nn.",
|
|
"not",
|
|
"nothin",
|
|
"nothin'",
|
|
"nothing",
|
|
"nothin\u2019",
|
|
"nov",
|
|
"nov.",
|
|
"now",
|
|
"ns.",
|
|
"nst",
|
|
"nt",
|
|
"nt.",
|
|
"nth",
|
|
"nts",
|
|
"nuff",
|
|
"nuthin",
|
|
"nuthin'",
|
|
"nuthin\u2019",
|
|
"n\u2019s",
|
|
"n\u2019t",
|
|
"o",
|
|
"o'clock",
|
|
"o's",
|
|
"o.",
|
|
"o.0",
|
|
"o.O",
|
|
"o.o",
|
|
"o_0",
|
|
"o_O",
|
|
"o_o",
|
|
"oblonata",
|
|
"ock",
|
|
"oco",
|
|
"oct",
|
|
"oct.",
|
|
"ods",
|
|
"oes",
|
|
"of",
|
|
"of.",
|
|
"oin",
|
|
"okla",
|
|
"okla.",
|
|
"oks",
|
|
"ol",
|
|
"ol'",
|
|
"old",
|
|
"olo",
|
|
"ol\u2019",
|
|
"on",
|
|
"onn",
|
|
"ons",
|
|
"ont",
|
|
"ood",
|
|
"openai",
|
|
"or",
|
|
"ore",
|
|
"ore.",
|
|
"ork",
|
|
"orp",
|
|
"os.",
|
|
"ose",
|
|
"ost",
|
|
"other",
|
|
"oud",
|
|
"ought",
|
|
"our",
|
|
"out",
|
|
"ov.",
|
|
"overview",
|
|
"o\u2019clock",
|
|
"o\u2019s",
|
|
"p",
|
|
"p.",
|
|
"p.m",
|
|
"p.m.",
|
|
"pa",
|
|
"pa.",
|
|
"paper",
|
|
"papers",
|
|
"per",
|
|
"ph",
|
|
"ph.d.",
|
|
"pisa",
|
|
"planets",
|
|
"pm",
|
|
"pneumonia",
|
|
"pollution",
|
|
"post",
|
|
"posted",
|
|
"posts",
|
|
"pou",
|
|
"pr.",
|
|
"problems",
|
|
"productivity",
|
|
"prof",
|
|
"prof.",
|
|
"project",
|
|
"prolonged",
|
|
"pt.",
|
|
"publications",
|
|
"published",
|
|
"q",
|
|
"q.",
|
|
"qa",
|
|
"question",
|
|
"r",
|
|
"r.",
|
|
"rad",
|
|
"ral",
|
|
"randrup",
|
|
"rc",
|
|
"rce",
|
|
"rch",
|
|
"rco",
|
|
"rdo",
|
|
"rds",
|
|
"re",
|
|
"re.",
|
|
"rea",
|
|
"read",
|
|
"really",
|
|
"rec",
|
|
"recent",
|
|
"recognition",
|
|
"red",
|
|
"referenece",
|
|
"regarding",
|
|
"reinforcement",
|
|
"related",
|
|
"relationship",
|
|
"released",
|
|
"rep",
|
|
"rep.",
|
|
"requires",
|
|
"res",
|
|
"research",
|
|
"retrieval",
|
|
"rev",
|
|
"rev.",
|
|
"review",
|
|
"rewards",
|
|
"rge",
|
|
"riz",
|
|
"rk.",
|
|
"rks",
|
|
"rlhf",
|
|
"rms",
|
|
"robotics",
|
|
"rof",
|
|
"rom",
|
|
"ros",
|
|
"rp.",
|
|
"rs.",
|
|
"rup",
|
|
"s",
|
|
"s's",
|
|
"s.",
|
|
"s.c.",
|
|
"scientific",
|
|
"screen",
|
|
"search",
|
|
"sed",
|
|
"seeber",
|
|
"sen",
|
|
"sen.",
|
|
"sep",
|
|
"sep.",
|
|
"sept",
|
|
"sept.",
|
|
"ses",
|
|
"set",
|
|
"sh.",
|
|
"sha",
|
|
"shall",
|
|
"she",
|
|
"she's",
|
|
"she\u2019s",
|
|
"should",
|
|
"sia",
|
|
"sic",
|
|
"siddhant",
|
|
"singh",
|
|
"sleep",
|
|
"sleeping",
|
|
"somethin",
|
|
"somethin'",
|
|
"something",
|
|
"somethin\u2019",
|
|
"space",
|
|
"squad",
|
|
"srs",
|
|
"ss.",
|
|
"st",
|
|
"st.",
|
|
"start",
|
|
"state",
|
|
"sts",
|
|
"studies",
|
|
"study",
|
|
"studying",
|
|
"suggestions",
|
|
"summarize",
|
|
"summary",
|
|
"survey",
|
|
"synthetic",
|
|
"s\u2019s",
|
|
"t",
|
|
"t's",
|
|
"t.",
|
|
"ta",
|
|
"talking",
|
|
"td.",
|
|
"teammates",
|
|
"ted",
|
|
"tem",
|
|
"ten",
|
|
"tenn",
|
|
"tenn.",
|
|
"ter",
|
|
"terms",
|
|
"tes",
|
|
"that",
|
|
"that's",
|
|
"that\u2019s",
|
|
"the",
|
|
"them",
|
|
"there",
|
|
"there's",
|
|
"there\u2019s",
|
|
"these",
|
|
"they",
|
|
"this",
|
|
"this's",
|
|
"this\u2019s",
|
|
"those",
|
|
"tic",
|
|
"time",
|
|
"title",
|
|
"titled",
|
|
"tle",
|
|
"to",
|
|
"topic",
|
|
"transformer",
|
|
"treat",
|
|
"treatment",
|
|
"trec",
|
|
"trends",
|
|
"triviaQA",
|
|
"triviaqa",
|
|
"trying",
|
|
"tumor",
|
|
"t\u2019s",
|
|
"u",
|
|
"u.",
|
|
"uad",
|
|
"uct",
|
|
"udy",
|
|
"uff",
|
|
"ug.",
|
|
"ul.",
|
|
"uld",
|
|
"uly",
|
|
"un.",
|
|
"understanding",
|
|
"university",
|
|
"unt",
|
|
"ure",
|
|
"us",
|
|
"use",
|
|
"using",
|
|
"ust",
|
|
"v",
|
|
"v.",
|
|
"v.s",
|
|
"v.s.",
|
|
"v.v",
|
|
"v_v",
|
|
"va",
|
|
"va.",
|
|
"vaccine",
|
|
"val",
|
|
"ve",
|
|
"vey",
|
|
"vid",
|
|
"vin",
|
|
"viruses",
|
|
"vs",
|
|
"vs.",
|
|
"w",
|
|
"w's",
|
|
"w.",
|
|
"w/o",
|
|
"want",
|
|
"warming",
|
|
"was",
|
|
"wash",
|
|
"wash.",
|
|
"we",
|
|
"were",
|
|
"what",
|
|
"what's",
|
|
"what\u2019s",
|
|
"when",
|
|
"when's",
|
|
"when\u2019s",
|
|
"where",
|
|
"where's",
|
|
"where\u2019s",
|
|
"who",
|
|
"who's",
|
|
"whose",
|
|
"who\u2019s",
|
|
"why",
|
|
"why's",
|
|
"why\u2019s",
|
|
"wikipedia",
|
|
"will",
|
|
"wis",
|
|
"wis.",
|
|
"without",
|
|
"wo",
|
|
"work",
|
|
"workers",
|
|
"working",
|
|
"works",
|
|
"would",
|
|
"write",
|
|
"written",
|
|
"w\u2019s",
|
|
"x",
|
|
"x'",
|
|
"x'x",
|
|
"x'xxxx",
|
|
"x.",
|
|
"x.X",
|
|
"x.d",
|
|
"x.x",
|
|
"x.x.",
|
|
"x/x",
|
|
"xD",
|
|
"xDD",
|
|
"xX",
|
|
"xXX",
|
|
"x_X",
|
|
"x_d",
|
|
"x_x",
|
|
"xd",
|
|
"xdd",
|
|
"xx",
|
|
"xx'",
|
|
"xx'x",
|
|
"xx'xx",
|
|
"xx.",
|
|
"xxx",
|
|
"xxx'x",
|
|
"xxx/xx",
|
|
"xxxx",
|
|
"xxxx'",
|
|
"xxxx'x",
|
|
"xxxxXX",
|
|
"xxxxXXX",
|
|
"xxxxd",
|
|
"xxxx\u2019",
|
|
"xxxx\u2019x",
|
|
"xxx\u2019x",
|
|
"xx\u2019",
|
|
"xx\u2019x",
|
|
"xx\u2019xx",
|
|
"xyz",
|
|
"x\u2019",
|
|
"x\u2019x",
|
|
"x\u2019xxxx",
|
|
"x\ufe35x",
|
|
"y",
|
|
"y'",
|
|
"y's",
|
|
"y.",
|
|
"ybe",
|
|
"you",
|
|
"your",
|
|
"y\u2019",
|
|
"y\u2019s",
|
|
"z",
|
|
"z.",
|
|
"|",
|
|
"}",
|
|
"\u00a0",
|
|
"\u00ac",
|
|
"\u00ac_\u00ac",
|
|
"\u00af",
|
|
"\u00af\\(x)/\u00af",
|
|
"\u00af\\(\u30c4)/\u00af",
|
|
"\u00b0",
|
|
"\u00b0C.",
|
|
"\u00b0F.",
|
|
"\u00b0K.",
|
|
"\u00b0X.",
|
|
"\u00b0c.",
|
|
"\u00b0f.",
|
|
"\u00b0k.",
|
|
"\u00b0x.",
|
|
"\u00e4",
|
|
"\u00e4.",
|
|
"\u00f6",
|
|
"\u00f6.",
|
|
"\u00fc",
|
|
"\u00fc.",
|
|
"\u0ca0",
|
|
"\u0ca0_\u0ca0",
|
|
"\u0ca0\ufe35\u0ca0",
|
|
"\u2014",
|
|
"\u2018",
|
|
"\u2018S",
|
|
"\u2018X",
|
|
"\u2018s",
|
|
"\u2018x",
|
|
"\u2019",
|
|
"\u2019-(",
|
|
"\u2019-)",
|
|
"\u2019Cause",
|
|
"\u2019Cos",
|
|
"\u2019Coz",
|
|
"\u2019Cuz",
|
|
"\u2019S",
|
|
"\u2019X",
|
|
"\u2019Xxx",
|
|
"\u2019Xxxxx",
|
|
"\u2019am",
|
|
"\u2019bout",
|
|
"\u2019cause",
|
|
"\u2019cos",
|
|
"\u2019coz",
|
|
"\u2019cuz",
|
|
"\u2019d",
|
|
"\u2019em",
|
|
"\u2019ll",
|
|
"\u2019m",
|
|
"\u2019nuff",
|
|
"\u2019re",
|
|
"\u2019s",
|
|
"\u2019ve",
|
|
"\u2019x",
|
|
"\u2019xx",
|
|
"\u2019xxx",
|
|
"\u2019xxxx",
|
|
"\u2019y",
|
|
"\u2019\u2019",
|
|
"\u2501",
|
|
"\u253b",
|
|
"\u253b\u2501\u253b",
|
|
"\u256f",
|
|
"\u25a1",
|
|
"\ufe35",
|
|
"\uff09"
|
|
] |