1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="utf-8" />
<meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no" />
<meta name="description" content="" />
<meta name="author" content="" />
<title>Tahapan Proximity Indexing Data Corona</title>
<!-- Font Awesome icons (free version)-->
<script src="https://use.fontawesome.com/releases/v5.13.0/js/all.js" crossorigin="anonymous"></script>
<!-- Google fonts-->
<link href="https://fonts.googleapis.com/css?family=Saira+Extra+Condensed:500,700" rel="stylesheet" type="text/css" />
<link href="https://fonts.googleapis.com/css?family=Muli:400,400i,800,800i" rel="stylesheet" type="text/css" />
<!-- Core theme CSS (includes Bootstrap)-->
<link href="../static/simulator_design/css/styles.css" rel="stylesheet" />
</head>
<body id="page-top">
<!-- Navigation-->
<nav class="navbar navbar-expand-lg navbar-dark bg-primary fixed-top" id="sideNav">
<a class="navbar-brand js-scroll-trigger" href="#page-top">
<span class="d-none d-lg-block"><img class="img-fluid img-profile rounded-circle mx-auto mb-2" src="../static/simulator_design/assets/img/logo_del.jpg" alt="" /></span></a>
<button class="navbar-toggler" type="button" data-toggle="collapse" data-target="#navbarSupportedContent" aria-controls="navbarSupportedContent" aria-expanded="false" aria-label="Toggle navigation"><span class="navbar-toggler-icon"></span></button>
<div class="collapse navbar-collapse" id="navbarSupportedContent">
<ul class="navbar-nav">
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#introduction">Tahapan Pencarian Kueri</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#preprocessingKueri">Preprocessing Kueri</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#tf">Perhitungan TF</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#df">Perhitungan DF</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#idf">Perhitungan IDF</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#tf-idf">Perhitungan TF-IDF</a></li>
<li class="nav-item"><a class="nav-link js-scroll-trigger" href="#perankinganScore">Perankingan Score</a></li>
<br> <br> <li class="nav-item"><a class="nav-link" href="..\result/">Kembali ke Hasil Pencarian</a></li>
</ul>
</div>
</nav>
<!-- Page Content-->
<div class="container-fluid p-0">
<!-- Simulator Indexing -->
<section class="resume-section" id="introduction">
<div class="resume-section-content">
<h1 class="mb-0">Tahapan<br><span class="text-primary">Pencarian Kueri</span></h1>
<br>
<p class="lead mb-5">
Tahapan Pencarian kueri adalah proses untuk mengolah kata pencarian yang di-input oleh user yang kemudian diproses oleh sistem untuk mengembalikan
dokumen yang relevan berdasarkan score tertinggi melalui perhitungan TF-IDF.
<br>
Adapun tahapan yang dilakukan untuk mengembalikan dokumen yang relevan berdasarkan pencarian kueri, yaitu:
<br> 1. Melakukan Preprocessing Kueri
<br> 2. Melakukan Perhitungan Term Frequency (TF)
<br> 3. Melakukan Perhitungan Document Frequency (DF)
<br> 4. Melakukan Perhitungan Inverse Document Frequency (IDF)
<br> 5. Melakukan Perhitungan TF-IDF
<br> 6. Melakukan Perankingan Score
</p>
</div>
</section>
<hr class="m-0" />
<!-- Preprocessing Kueri -->
<section class="resume-section" id="preprocessingKueri">
<div class="resume-section-content">
<h2 class="mb-5">Preprocessing Kueri</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p>Tahapan preprocessing merupakan tahapan yang dilakukan pada kueri untuk mengubah bentuk kueri ke bentuk lain sehingga
kueri tersebut dapat dikenali dan diproses oleh sistem. Adapun tahapan yang dilakukan pada tahapan preprocessing adalah
case folding, remove punctuation, number removal, tokenisasi, stop word removal dan stemming.
Berikut adalah hasil preprocessing dari kueri yang dimasukkan.</p>
<br>
<p><b>Kueri Anda </b> => <code> {{ query }} </code></p>
<br>
<p> <b>Hasil Preprocessing Kueri </b> => <code> {% for i in proximitys.process %} {{ i.terms }} {% endfor %} </code><br></p>
</div>
</div>
</div>
</section>
<hr class="m-0" />
<!-- Perhitungan TF -->
<section class="resume-section" id="tf">
<div class="resume-section-content">
<h2 class="mb-5">Perhitungan Term Frequency (TF)</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p>Selanjutnya akan dilakukan proses perhitungan TF. Perhitungan nilai Term Frequency (TF) yaitu perhitungan
yang memandang sebuah dokumen sebagai sebuah bag of words yang mengutamakan jumlah kemunculan dari setiap kata. Berikut merupakan hasil
dari perhitungan TF dari kueri pencarian. </p>
<p> <b>Hasil Preprocessing Kueri </b> => <code> {% for i in proximitys.process %} {{ i.terms }} {% endfor %} </code></p>
<p> <b>Term Frequency </b> => <code> {% for i in proximitys.process %} {{ i.termFrequency }} {% endfor %} </code> </p>
</div>
</div>
</div>
</section>
<hr class="m-0" />
<!-- Perhitungan DF -->
<section class="resume-section" id="df">
<div class="resume-section-content">
<h2 class="mb-5">Perhitungan Document Frequency (DF)</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p>Document Frequency (DF) adalah jumlah dari dokumen di dalamnya terdapat term yang sedang diinvestigasi. Jika sebuah dokumen
terdapat term yang sedang diinvestigasi maka dokumen tersebut akan bernilai 1. Begitu selanjutnya dilakukan pemeriksaan terhadap seluruh dokumen
sehingga diperoleh total dokumen yang mengandung term tersebut. Berikut merupakan hasil dari perhitungan DF dari kueri pencarian. </p>
<p> <b>Hasil Preprocessing Kueri </b> => <code> {% for i in proximitys.process %} {{ i.terms }} {% endfor %} </code></p>
<p> <b>Document Frequency </b> => <code> {% for i in proximitys.process %} {{ i.docFrequency }} {% endfor %} </code> </p>
</div>
</div>
</div>
</section>
<hr class="m-0" />
<!-- Perhitungan IDF -->
<section class="resume-section" id="idf">
<div class="resume-section-content">
<h2 class="mb-5">Perhitungan IDF</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p> Persamaan Inverse Document Frequency dibuat untuk mengurangi efek dari term yang frekuensinya terlalu tinggi dalam sebuah dokumen. Proses ini
dapat diperoleh dengan menghitung nilai logaritma dari total dokumen dibagi dengan DF dari term yang sedang diinvestigasi. Persamaan tersebut
dapat dituliskan dengan IDF(i) = log (N/DF(i)). Berikut merupakan hasil dari perhitungan IDF dari kueri pencarian. </p>
<p> <b>Hasil Preprocessing Kueri </b> => <code> {% for i in proximitys.process %} {{ i.terms }} {% endfor %} </code></p>
<p> <b> Inverse Document Frequency </b>=> <code> {% for i in proximitys.process %} {{ i.invDocFrequency }} {% endfor %} </code></p>
</div>
</div>
</div>
</section>
<hr class="m-0" />
<!-- Perhitungan TF-IDF -->
<section class="resume-section" id="tf-idf">
<div class="resume-section-content">
<h2 class="mb-5">Perhitungan TF-IDF</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p> Dengan memperoleh nilai dari masing-masing TF, DF dan IDF, maka untuk menghitung nilai dari TF-IDF untuk kasus dengan menggunakan word t
dalam document d dapat dihitung dengan persamaan W(t,d) = TF(t,d) X IDF(t). Berikut merupakan hasil dari perhitungan TF-IDF dari kueri pencarian
dengan mengembalikan nomor setiap dokumen.</p>
<p> <b>Hasil Preprocessing Kueri </b> => <code> {% for i in proximitys.process %} {{ i.terms }} {% endfor %} </code></p>
<p><b> TF-IDF </b> => <code> {% for i in proximitys.process %} {{ i.TFIDF }} {% endfor %} </code></p>
</div>
</div>
</div>
</section>
<hr class="m-0" />
<!-- Perankingan Skor -->
<section class="resume-section" id="perankinganScore">
<div class="resume-section-content">
<h2 class="mb-5">Perankingan Score</h2>
<div class="d-flex flex-column flex-md-row justify-content-between mb-5">
<div class="flex-grow-1">
<p>Setelah dilakukan perhitungan TF-IDF, kemudian dilakukan perangkingan berdasarkan score tertinggi dari setiap nilai TF-IDF.</p>
<br>
{% for i in proximitys.result %}
{{forloop.counter}}.
Judul : <code> {{ i.doc_title }} </code><br>
    No dokumen: <code> {{ i.doc_id }} </code><br>
    Score : <code> {{ i.doc_score }} </code><br>
<br><br>
{% endfor %}
</div>
</div>
</div>
</section>
</div>
<!-- Bootstrap core JS-->
<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.5.1/jquery.min.js"></script>
<script src="https://stackpath.bootstrapcdn.com/bootstrap/4.5.0/js/bootstrap.bundle.min.js"></script>
<!-- Third party plugin JS-->
<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery-easing/1.4.1/jquery.easing.min.js"></script>
<!-- Core theme JS-->
<script src="../static/simulator_design/js/scripts.js"></script>
</body>
</html>