diff --git "a/README.md" "b/README.md"
--- "a/README.md"
+++ "b/README.md"
@@ -26,89 +26,15 @@ widget:
     - en
     - en
     lemmatized:
-    - - clear
-      - compelling
-      - evidence
-      - many
-      - major
-      - conclusion
-      - ipcc
-      - new
-      - religion
-      - constantly-changing
-      - holy
-      - book
-      - based
-      - evidence
-      - fabricated
-      - hockey
-      - stick
-      - graph
-      - purported
-      - abolish
-      - mediaeval
-      - warm
-      - period
-      - one
-      - example
-    - - holocene
-      - last
-      - 10k
-      - year
-      - sea
-      - level
-      - rising
-      - rate
-      - around
-      - 2mm
-      - per
-      - year
-      - climate
-      - change
-      - little
-      - '''s'
-      - simply
-      - long
-      - term
-      - inevitability
-      - end
-      - current
-      - interglacial
-      - return
-      - glacial
-      - period
-      - regret
-    - - china
-      - host
-      - u.n.
-      - climate
-      - talk
-      - next
-      - week
-      - first
-      - time
-      - promoting
-      - call
-      - ambitious
-      - plan
-      - boost
-      - energy
-      - efficiency
-      - curb
-      - emission
-      - supercharged
-      - growth
-      - mean
-      - even
-      - rapid
-      - efficiency
-      - gain
-      - cancel
-      - global
-      - effort
-      - combat
-      - climate
-      - change
+    - clear compelling evidence many major conclusion ipcc new religion constantly-changing
+      holy book based evidence fabricated hockey stick graph purported abolish mediaeval
+      warm period one example
+    - holocene last 10k year sea level rising rate around 2mm per year climate change
+      little 's simply long term inevitability end current interglacial return glacial
+      period regret
+    - china host u.n. climate talk next week first time promoting call ambitious plan
+      boost energy efficiency curb emission supercharged growth mean even rapid efficiency
+      gain cancel global effort combat climate change
     quote:
     - There is clear, compelling evidence that many of the major conclusions of the
       IPCC, your new religions constantly-changing Holy Book, are based on evidence
@@ -240,16 +166,16 @@ This model is not ready to be used in production.
 | Hyperparameter                | Value                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
 |-------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
 | memory                        |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| steps                         | [('lemmatizer', FunctionTransformer(func=<function lemmatize_X at 0x7f7a77c96550>)), ('tfidf', TfidfVectorizer(max_df=0.95, min_df=2,<br />                stop_words=['i', ',', 'you', '(', 'it', '\\', '*', 'that', 'do',<br />                            'needn', 'doesn', 'won', 'which', 'been', 'aren',<br />                            'more', 'while', 'until', 'hadn', '^', 'was', '=',<br />                            'their', 'o', 'are', 'by', "don't", 'ours',<br />                            'yourself', 'ma', ...],<br />                tokenizer=<function tokenize_quote at 0x7f7b459159d0>)), ('rf', RandomForestClassifier(bootstrap=False, max_features=0.35, min_samples_leaf=4,<br />                       min_samples_split=7, n_estimators=155))]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| steps                         | [('lemmatizer', FunctionTransformer(func=<function lemmatize_X at 0x7fb4a5fb33a0>)), ('tfidf', TfidfVectorizer(max_df=0.95, min_df=2,<br />                stop_words=['just', 'himself', 'most', '"', '|', 'where',<br />                            'didn', 'with', '(', 'at', 'once', 'she', 'do',<br />                            'below', 'y', 'having', 'about', '^', ')', '@',<br />                            'theirs', "wasn't", 'the', 'wouldn', 'for', 'after',<br />                            'to', "you'll", ';', 'over', ...],<br />                tokenizer=<function tokenize_quote at 0x7fb4a5fb31f0>)), ('rf', RandomForestClassifier())]                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | transform_input               |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | verbose                       | False                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
-| lemmatizer                    | FunctionTransformer(func=<function lemmatize_X at 0x7f7a77c96550>)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 |
-| tfidf                         | TfidfVectorizer(max_df=0.95, min_df=2,<br />                stop_words=['i', ',', 'you', '(', 'it', '\\', '*', 'that', 'do',<br />                            'needn', 'doesn', 'won', 'which', 'been', 'aren',<br />                            'more', 'while', 'until', 'hadn', '^', 'was', '=',<br />                            'their', 'o', 'are', 'by', "don't", 'ours',<br />                            'yourself', 'ma', ...],<br />                tokenizer=<function tokenize_quote at 0x7f7b459159d0>)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| rf                            | RandomForestClassifier(bootstrap=False, max_features=0.35, min_samples_leaf=4,<br />                       min_samples_split=7, n_estimators=155)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| lemmatizer                    | FunctionTransformer(func=<function lemmatize_X at 0x7fb4a5fb33a0>)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 |
+| tfidf                         | TfidfVectorizer(max_df=0.95, min_df=2,<br />                stop_words=['just', 'himself', 'most', '"', '|', 'where',<br />                            'didn', 'with', '(', 'at', 'once', 'she', 'do',<br />                            'below', 'y', 'having', 'about', '^', ')', '@',<br />                            'theirs', "wasn't", 'the', 'wouldn', 'for', 'after',<br />                            'to', "you'll", ';', 'over', ...],<br />                tokenizer=<function tokenize_quote at 0x7fb4a5fb31f0>)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
+| rf                            | RandomForestClassifier()                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
 | lemmatizer__accept_sparse     | False                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
 | lemmatizer__check_inverse     | True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
 | lemmatizer__feature_names_out |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| lemmatizer__func              | <function lemmatize_X at 0x7f7a77c96550>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
+| lemmatizer__func              | <function lemmatize_X at 0x7fb4a5fb33a0>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                           |
 | lemmatizer__inv_kw_args       |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | lemmatizer__inverse_func      |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | lemmatizer__kw_args           |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
@@ -268,27 +194,27 @@ This model is not ready to be used in production.
 | tfidf__norm                   | l2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                 |
 | tfidf__preprocessor           |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | tfidf__smooth_idf             | True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
-| tfidf__stop_words             | ['i', ',', 'you', '(', 'it', '\\', '*', 'that', 'do', 'needn', 'doesn', 'won', 'which', 'been', 'aren', 'more', 'while', 'until', 'hadn', '^', 'was', '=', 'their', 'o', 'are', 'by', "don't", 'ours', 'yourself', 'ma', 'against', '~', 'just', 'her', 'hers', '`', 'through', 'if', "hadn't", "haven't", 'theirs', 'those', 'don', 'nor', 'its', "you'll", 'each', 'and', 'should', 'me', "shan't", 'she', 'were', 'to', 'hasn', "'", 'his', 'we', ';', 'over', 'couldn', 'into', 'y', 'our', 'down', "that'll", 'up', 'how', 'now', '"', 'myself', 'itself', 'them', '}', 'my', '.', 'because', 'did', "weren't", "should've", 'haven', 'once', '#', ']', '_', "you're", 'than', '/', "hasn't", 'll', 'the', '$', '{', 'so', 'mustn', 'only', 'they', 'off', "mightn't", 's', 'wasn', 'him', "wouldn't", 'not', 'mightn', '[', 'with', '-', 'some', 'didn', "isn't", "doesn't", "mustn't", 'most', 'isn', 'who', 'out', 'weren', 'being', '>', 'few', "you'd", 'wouldn', 'yourselves', 'has', '|', 'when', 'why', 'before', "aren't", '+', 'further', 'a', 'same', 'ain', 're', "she's", "it's", 'this', 'is', 'own', "shouldn't", 'ourselves', 'below', "needn't", 'very', 'your', ':', '@', 'having', 'doing', "wasn't", 'he', 'have', 'whom', 'as', 'no', 'all', 'where', "didn't", 'yours', 'other', 'or', '?', 'had', 'from', 'there', 'd', 'both', "won't", 'am', 'during', 'under', 't', 'again', 'here', 'too', '&', 'any', 'for', 'shan', 'of', 've', 'an', 'these', 'such', 'herself', 'at', 'can', 'be', 'does', 'about', "couldn't", 'themselves', 'above', 'will', '<', 'between', 'on', "you've", 'what', 'then', '!', 'in', 'himself', '%', ')', 'after', 'm', 'but', 'shouldn'] |
+| tfidf__stop_words             | ['just', 'himself', 'most', '"', '|', 'where', 'didn', 'with', '(', 'at', 'once', 'she', 'do', 'below', 'y', 'having', 'about', '^', ')', '@', 'theirs', "wasn't", 'the', 'wouldn', 'for', 'after', 'to', "you'll", ';', 'over', 'why', 'those', 'hers', 'should', 'their', 'is', 'weren', 'doesn', "you've", 'we', 'been', 'did', 'further', "shouldn't", 'during', '%', 'a', 'into', 'mustn', '=', 'under', 'are', 'very', 'don', 'm', 'before', 'i', 'too', 'you', 'which', 'such', 'o', "hadn't", 'what', 'of', 't', 've', 'them', '[', 'some', "don't", "isn't", 'his', 'd', 'mightn', '{', '/', 're', 'whom', 'now', 'same', 'above', 'own', 'was', 'in', 'up', 'shouldn', 'more', 'while', 'from', 'here', 'because', '+', 'were', 'each', "mightn't", "aren't", "it's", "you're", 'how', 'they', 'itself', 'wasn', 'aren', '<', 'as', 'ourselves', "doesn't", 'hadn', "won't", 'other', ':', "weren't", '*', 'he', 'hasn', "hasn't", "you'd", 'through', "wouldn't", '!', 'by', 'couldn', ',', 'these', '$', '~', 'any', 'when', "that'll", 'out', 'there', 'has', 'off', 'not', 'until', 'than', "didn't", 'will', "mustn't", 'am', 'that', 'll', 'yourselves', 'my', '`', '_', 'this', 'ma', 'her', 'an', 'its', 'herself', 'but', 'between', 'ain', 'nor', "shan't", '}', '?', 'had', 'themselves', 'our', "she's", 'against', 'or', 'few', "should've", '&', 'have', "haven't", "'", 'then', "couldn't", 'and', 'being', 'doing', ']', '.', '-', "needn't", 'yours', 'only', 'myself', 'all', 'does', 'haven', 's', 'again', 'no', 'won', '>', 'if', 'isn', 'me', 'so', 'yourself', 'be', 'can', '#', 'ours', 'both', 'down', 'shan', 'it', 'him', 'who', 'on', 'your', 'needn', '\\'] |
 | tfidf__strip_accents          |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | tfidf__sublinear_tf           | False                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
 | tfidf__token_pattern          | (?u)\b\w\w+\b                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      |
-| tfidf__tokenizer              | <function tokenize_quote at 0x7f7b459159d0>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
+| tfidf__tokenizer              | <function tokenize_quote at 0x7fb4a5fb31f0>                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        |
 | tfidf__use_idf                | True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
 | tfidf__vocabulary             |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| rf__bootstrap                 | False                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
+| rf__bootstrap                 | True                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
 | rf__ccp_alpha                 | 0.0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
 | rf__class_weight              |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | rf__criterion                 | gini                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
 | rf__max_depth                 |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| rf__max_features              | 0.35                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
+| rf__max_features              | sqrt                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
 | rf__max_leaf_nodes            |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | rf__max_samples               |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | rf__min_impurity_decrease     | 0.0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
-| rf__min_samples_leaf          | 4                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
-| rf__min_samples_split         | 7                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
+| rf__min_samples_leaf          | 1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
+| rf__min_samples_split         | 2                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
 | rf__min_weight_fraction_leaf  | 0.0                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
 | rf__monotonic_cst             |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
-| rf__n_estimators              | 155                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
+| rf__n_estimators              | 100                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
 | rf__n_jobs                    |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
 | rf__oob_score                 | False                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              |
 | rf__random_state              |                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    |
@@ -299,58 +225,58 @@ This model is not ready to be used in production.
 
 ### Model Plot
 
-<style>#sk-container-id-36 {/* Definition of color scheme common for light and dark mode */--sklearn-color-text: #000;--sklearn-color-text-muted: #666;--sklearn-color-line: gray;/* Definition of color scheme for unfitted estimators */--sklearn-color-unfitted-level-0: #fff5e6;--sklearn-color-unfitted-level-1: #f6e4d2;--sklearn-color-unfitted-level-2: #ffe0b3;--sklearn-color-unfitted-level-3: chocolate;/* Definition of color scheme for fitted estimators */--sklearn-color-fitted-level-0: #f0f8ff;--sklearn-color-fitted-level-1: #d4ebff;--sklearn-color-fitted-level-2: #b3dbfd;--sklearn-color-fitted-level-3: cornflowerblue;/* Specific color for light theme */--sklearn-color-text-on-default-background: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, black)));--sklearn-color-background: var(--sg-background-color, var(--theme-background, var(--jp-layout-color0, white)));--sklearn-color-border-box: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, black)));--sklearn-color-icon: #696969;@media (prefers-color-scheme: dark) {/* Redefinition of color scheme for dark theme */--sklearn-color-text-on-default-background: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, white)));--sklearn-color-background: var(--sg-background-color, var(--theme-background, var(--jp-layout-color0, #111)));--sklearn-color-border-box: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, white)));--sklearn-color-icon: #878787;}
-}#sk-container-id-36 {color: var(--sklearn-color-text);
-}#sk-container-id-36 pre {padding: 0;
-}#sk-container-id-36 input.sk-hidden--visually {border: 0;clip: rect(1px 1px 1px 1px);clip: rect(1px, 1px, 1px, 1px);height: 1px;margin: -1px;overflow: hidden;padding: 0;position: absolute;width: 1px;
-}#sk-container-id-36 div.sk-dashed-wrapped {border: 1px dashed var(--sklearn-color-line);margin: 0 0.4em 0.5em 0.4em;box-sizing: border-box;padding-bottom: 0.4em;background-color: var(--sklearn-color-background);
-}#sk-container-id-36 div.sk-container {/* jupyter's `normalize.less` sets `[hidden] { display: none; }`but bootstrap.min.css set `[hidden] { display: none !important; }`so we also need the `!important` here to be able to override thedefault hidden behavior on the sphinx rendered scikit-learn.org.See: https://github.com/scikit-learn/scikit-learn/issues/21755 */display: inline-block !important;position: relative;
-}#sk-container-id-36 div.sk-text-repr-fallback {display: none;
+<style>#sk-container-id-8 {/* Definition of color scheme common for light and dark mode */--sklearn-color-text: #000;--sklearn-color-text-muted: #666;--sklearn-color-line: gray;/* Definition of color scheme for unfitted estimators */--sklearn-color-unfitted-level-0: #fff5e6;--sklearn-color-unfitted-level-1: #f6e4d2;--sklearn-color-unfitted-level-2: #ffe0b3;--sklearn-color-unfitted-level-3: chocolate;/* Definition of color scheme for fitted estimators */--sklearn-color-fitted-level-0: #f0f8ff;--sklearn-color-fitted-level-1: #d4ebff;--sklearn-color-fitted-level-2: #b3dbfd;--sklearn-color-fitted-level-3: cornflowerblue;/* Specific color for light theme */--sklearn-color-text-on-default-background: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, black)));--sklearn-color-background: var(--sg-background-color, var(--theme-background, var(--jp-layout-color0, white)));--sklearn-color-border-box: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, black)));--sklearn-color-icon: #696969;@media (prefers-color-scheme: dark) {/* Redefinition of color scheme for dark theme */--sklearn-color-text-on-default-background: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, white)));--sklearn-color-background: var(--sg-background-color, var(--theme-background, var(--jp-layout-color0, #111)));--sklearn-color-border-box: var(--sg-text-color, var(--theme-code-foreground, var(--jp-content-font-color1, white)));--sklearn-color-icon: #878787;}
+}#sk-container-id-8 {color: var(--sklearn-color-text);
+}#sk-container-id-8 pre {padding: 0;
+}#sk-container-id-8 input.sk-hidden--visually {border: 0;clip: rect(1px 1px 1px 1px);clip: rect(1px, 1px, 1px, 1px);height: 1px;margin: -1px;overflow: hidden;padding: 0;position: absolute;width: 1px;
+}#sk-container-id-8 div.sk-dashed-wrapped {border: 1px dashed var(--sklearn-color-line);margin: 0 0.4em 0.5em 0.4em;box-sizing: border-box;padding-bottom: 0.4em;background-color: var(--sklearn-color-background);
+}#sk-container-id-8 div.sk-container {/* jupyter's `normalize.less` sets `[hidden] { display: none; }`but bootstrap.min.css set `[hidden] { display: none !important; }`so we also need the `!important` here to be able to override thedefault hidden behavior on the sphinx rendered scikit-learn.org.See: https://github.com/scikit-learn/scikit-learn/issues/21755 */display: inline-block !important;position: relative;
+}#sk-container-id-8 div.sk-text-repr-fallback {display: none;
 }div.sk-parallel-item,
 div.sk-serial,
 div.sk-item {/* draw centered vertical line to link estimators */background-image: linear-gradient(var(--sklearn-color-text-on-default-background), var(--sklearn-color-text-on-default-background));background-size: 2px 100%;background-repeat: no-repeat;background-position: center center;
-}/* Parallel-specific style estimator block */#sk-container-id-36 div.sk-parallel-item::after {content: "";width: 100%;border-bottom: 2px solid var(--sklearn-color-text-on-default-background);flex-grow: 1;
-}#sk-container-id-36 div.sk-parallel {display: flex;align-items: stretch;justify-content: center;background-color: var(--sklearn-color-background);position: relative;
-}#sk-container-id-36 div.sk-parallel-item {display: flex;flex-direction: column;
-}#sk-container-id-36 div.sk-parallel-item:first-child::after {align-self: flex-end;width: 50%;
-}#sk-container-id-36 div.sk-parallel-item:last-child::after {align-self: flex-start;width: 50%;
-}#sk-container-id-36 div.sk-parallel-item:only-child::after {width: 0;
-}/* Serial-specific style estimator block */#sk-container-id-36 div.sk-serial {display: flex;flex-direction: column;align-items: center;background-color: var(--sklearn-color-background);padding-right: 1em;padding-left: 1em;
+}/* Parallel-specific style estimator block */#sk-container-id-8 div.sk-parallel-item::after {content: "";width: 100%;border-bottom: 2px solid var(--sklearn-color-text-on-default-background);flex-grow: 1;
+}#sk-container-id-8 div.sk-parallel {display: flex;align-items: stretch;justify-content: center;background-color: var(--sklearn-color-background);position: relative;
+}#sk-container-id-8 div.sk-parallel-item {display: flex;flex-direction: column;
+}#sk-container-id-8 div.sk-parallel-item:first-child::after {align-self: flex-end;width: 50%;
+}#sk-container-id-8 div.sk-parallel-item:last-child::after {align-self: flex-start;width: 50%;
+}#sk-container-id-8 div.sk-parallel-item:only-child::after {width: 0;
+}/* Serial-specific style estimator block */#sk-container-id-8 div.sk-serial {display: flex;flex-direction: column;align-items: center;background-color: var(--sklearn-color-background);padding-right: 1em;padding-left: 1em;
 }/* Toggleable style: style used for estimator/Pipeline/ColumnTransformer box that is
 clickable and can be expanded/collapsed.
 - Pipeline and ColumnTransformer use this feature and define the default style
 - Estimators will overwrite some part of the style using the `sk-estimator` class
-*//* Pipeline and ColumnTransformer style (default) */#sk-container-id-36 div.sk-toggleable {/* Default theme specific background. It is overwritten whether we have aspecific estimator or a Pipeline/ColumnTransformer */background-color: var(--sklearn-color-background);
+*//* Pipeline and ColumnTransformer style (default) */#sk-container-id-8 div.sk-toggleable {/* Default theme specific background. It is overwritten whether we have aspecific estimator or a Pipeline/ColumnTransformer */background-color: var(--sklearn-color-background);
 }/* Toggleable label */
-#sk-container-id-36 label.sk-toggleable__label {cursor: pointer;display: flex;width: 100%;margin-bottom: 0;padding: 0.5em;box-sizing: border-box;text-align: center;align-items: start;justify-content: space-between;gap: 0.5em;
-}#sk-container-id-36 label.sk-toggleable__label .caption {font-size: 0.6rem;font-weight: lighter;color: var(--sklearn-color-text-muted);
-}#sk-container-id-36 label.sk-toggleable__label-arrow:before {/* Arrow on the left of the label */content: "▸";float: left;margin-right: 0.25em;color: var(--sklearn-color-icon);
-}#sk-container-id-36 label.sk-toggleable__label-arrow:hover:before {color: var(--sklearn-color-text);
-}/* Toggleable content - dropdown */#sk-container-id-36 div.sk-toggleable__content {max-height: 0;max-width: 0;overflow: hidden;text-align: left;/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
-}#sk-container-id-36 div.sk-toggleable__content.fitted {/* fitted */background-color: var(--sklearn-color-fitted-level-0);
-}#sk-container-id-36 div.sk-toggleable__content pre {margin: 0.2em;border-radius: 0.25em;color: var(--sklearn-color-text);/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
-}#sk-container-id-36 div.sk-toggleable__content.fitted pre {/* unfitted */background-color: var(--sklearn-color-fitted-level-0);
-}#sk-container-id-36 input.sk-toggleable__control:checked~div.sk-toggleable__content {/* Expand drop-down */max-height: 200px;max-width: 100%;overflow: auto;
-}#sk-container-id-36 input.sk-toggleable__control:checked~label.sk-toggleable__label-arrow:before {content: "▾";
-}/* Pipeline/ColumnTransformer-specific style */#sk-container-id-36 div.sk-label input.sk-toggleable__control:checked~label.sk-toggleable__label {color: var(--sklearn-color-text);background-color: var(--sklearn-color-unfitted-level-2);
-}#sk-container-id-36 div.sk-label.fitted input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: var(--sklearn-color-fitted-level-2);
+#sk-container-id-8 label.sk-toggleable__label {cursor: pointer;display: flex;width: 100%;margin-bottom: 0;padding: 0.5em;box-sizing: border-box;text-align: center;align-items: start;justify-content: space-between;gap: 0.5em;
+}#sk-container-id-8 label.sk-toggleable__label .caption {font-size: 0.6rem;font-weight: lighter;color: var(--sklearn-color-text-muted);
+}#sk-container-id-8 label.sk-toggleable__label-arrow:before {/* Arrow on the left of the label */content: "▸";float: left;margin-right: 0.25em;color: var(--sklearn-color-icon);
+}#sk-container-id-8 label.sk-toggleable__label-arrow:hover:before {color: var(--sklearn-color-text);
+}/* Toggleable content - dropdown */#sk-container-id-8 div.sk-toggleable__content {max-height: 0;max-width: 0;overflow: hidden;text-align: left;/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
+}#sk-container-id-8 div.sk-toggleable__content.fitted {/* fitted */background-color: var(--sklearn-color-fitted-level-0);
+}#sk-container-id-8 div.sk-toggleable__content pre {margin: 0.2em;border-radius: 0.25em;color: var(--sklearn-color-text);/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
+}#sk-container-id-8 div.sk-toggleable__content.fitted pre {/* unfitted */background-color: var(--sklearn-color-fitted-level-0);
+}#sk-container-id-8 input.sk-toggleable__control:checked~div.sk-toggleable__content {/* Expand drop-down */max-height: 200px;max-width: 100%;overflow: auto;
+}#sk-container-id-8 input.sk-toggleable__control:checked~label.sk-toggleable__label-arrow:before {content: "▾";
+}/* Pipeline/ColumnTransformer-specific style */#sk-container-id-8 div.sk-label input.sk-toggleable__control:checked~label.sk-toggleable__label {color: var(--sklearn-color-text);background-color: var(--sklearn-color-unfitted-level-2);
+}#sk-container-id-8 div.sk-label.fitted input.sk-toggleable__control:checked~label.sk-toggleable__label {background-color: var(--sklearn-color-fitted-level-2);
 }/* Estimator-specific style *//* Colorize estimator box */
-#sk-container-id-36 div.sk-estimator input.sk-toggleable__control:checked~label.sk-toggleable__label {/* unfitted */background-color: var(--sklearn-color-unfitted-level-2);
-}#sk-container-id-36 div.sk-estimator.fitted input.sk-toggleable__control:checked~label.sk-toggleable__label {/* fitted */background-color: var(--sklearn-color-fitted-level-2);
-}#sk-container-id-36 div.sk-label label.sk-toggleable__label,
-#sk-container-id-36 div.sk-label label {/* The background is the default theme color */color: var(--sklearn-color-text-on-default-background);
+#sk-container-id-8 div.sk-estimator input.sk-toggleable__control:checked~label.sk-toggleable__label {/* unfitted */background-color: var(--sklearn-color-unfitted-level-2);
+}#sk-container-id-8 div.sk-estimator.fitted input.sk-toggleable__control:checked~label.sk-toggleable__label {/* fitted */background-color: var(--sklearn-color-fitted-level-2);
+}#sk-container-id-8 div.sk-label label.sk-toggleable__label,
+#sk-container-id-8 div.sk-label label {/* The background is the default theme color */color: var(--sklearn-color-text-on-default-background);
 }/* On hover, darken the color of the background */
-#sk-container-id-36 div.sk-label:hover label.sk-toggleable__label {color: var(--sklearn-color-text);background-color: var(--sklearn-color-unfitted-level-2);
+#sk-container-id-8 div.sk-label:hover label.sk-toggleable__label {color: var(--sklearn-color-text);background-color: var(--sklearn-color-unfitted-level-2);
 }/* Label box, darken color on hover, fitted */
-#sk-container-id-36 div.sk-label.fitted:hover label.sk-toggleable__label.fitted {color: var(--sklearn-color-text);background-color: var(--sklearn-color-fitted-level-2);
-}/* Estimator label */#sk-container-id-36 div.sk-label label {font-family: monospace;font-weight: bold;display: inline-block;line-height: 1.2em;
-}#sk-container-id-36 div.sk-label-container {text-align: center;
+#sk-container-id-8 div.sk-label.fitted:hover label.sk-toggleable__label.fitted {color: var(--sklearn-color-text);background-color: var(--sklearn-color-fitted-level-2);
+}/* Estimator label */#sk-container-id-8 div.sk-label label {font-family: monospace;font-weight: bold;display: inline-block;line-height: 1.2em;
+}#sk-container-id-8 div.sk-label-container {text-align: center;
 }/* Estimator-specific */
-#sk-container-id-36 div.sk-estimator {font-family: monospace;border: 1px dotted var(--sklearn-color-border-box);border-radius: 0.25em;box-sizing: border-box;margin-bottom: 0.5em;/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
-}#sk-container-id-36 div.sk-estimator.fitted {/* fitted */background-color: var(--sklearn-color-fitted-level-0);
+#sk-container-id-8 div.sk-estimator {font-family: monospace;border: 1px dotted var(--sklearn-color-border-box);border-radius: 0.25em;box-sizing: border-box;margin-bottom: 0.5em;/* unfitted */background-color: var(--sklearn-color-unfitted-level-0);
+}#sk-container-id-8 div.sk-estimator.fitted {/* fitted */background-color: var(--sklearn-color-fitted-level-0);
 }/* on hover */
-#sk-container-id-36 div.sk-estimator:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-2);
-}#sk-container-id-36 div.sk-estimator.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-2);
+#sk-container-id-8 div.sk-estimator:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-2);
+}#sk-container-id-8 div.sk-estimator.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-2);
 }/* Specification for estimator info (e.g. "i" and "?") *//* Common style for "i" and "?" */.sk-estimator-doc-link,
 a:link.sk-estimator-doc-link,
 a:visited.sk-estimator-doc-link {float: right;font-size: smaller;line-height: 1em;font-family: monospace;background-color: var(--sklearn-color-background);border-radius: 1em;height: 1em;width: 1em;text-decoration: none !important;margin-left: 0.5em;text-align: center;/* unfitted */border: var(--sklearn-color-unfitted-level-1) 1pt solid;color: var(--sklearn-color-unfitted-level-1);
@@ -370,20 +296,20 @@ div.sk-label-container:hover .sk-estimator-doc-link.fitted:hover,
 .sk-estimator-doc-link span {display: none;z-index: 9999;position: relative;font-weight: normal;right: .2ex;padding: .5ex;margin: .5ex;width: min-content;min-width: 20ex;max-width: 50ex;color: var(--sklearn-color-text);box-shadow: 2pt 2pt 4pt #999;/* unfitted */background: var(--sklearn-color-unfitted-level-0);border: .5pt solid var(--sklearn-color-unfitted-level-3);
 }.sk-estimator-doc-link.fitted span {/* fitted */background: var(--sklearn-color-fitted-level-0);border: var(--sklearn-color-fitted-level-3);
 }.sk-estimator-doc-link:hover span {display: block;
-}/* "?"-specific style due to the `<a>` HTML tag */#sk-container-id-36 a.estimator_doc_link {float: right;font-size: 1rem;line-height: 1em;font-family: monospace;background-color: var(--sklearn-color-background);border-radius: 1rem;height: 1rem;width: 1rem;text-decoration: none;/* unfitted */color: var(--sklearn-color-unfitted-level-1);border: var(--sklearn-color-unfitted-level-1) 1pt solid;
-}#sk-container-id-36 a.estimator_doc_link.fitted {/* fitted */border: var(--sklearn-color-fitted-level-1) 1pt solid;color: var(--sklearn-color-fitted-level-1);
+}/* "?"-specific style due to the `<a>` HTML tag */#sk-container-id-8 a.estimator_doc_link {float: right;font-size: 1rem;line-height: 1em;font-family: monospace;background-color: var(--sklearn-color-background);border-radius: 1rem;height: 1rem;width: 1rem;text-decoration: none;/* unfitted */color: var(--sklearn-color-unfitted-level-1);border: var(--sklearn-color-unfitted-level-1) 1pt solid;
+}#sk-container-id-8 a.estimator_doc_link.fitted {/* fitted */border: var(--sklearn-color-fitted-level-1) 1pt solid;color: var(--sklearn-color-fitted-level-1);
 }/* On hover */
-#sk-container-id-36 a.estimator_doc_link:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-3);color: var(--sklearn-color-background);text-decoration: none;
-}#sk-container-id-36 a.estimator_doc_link.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-3);
+#sk-container-id-8 a.estimator_doc_link:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-3);color: var(--sklearn-color-background);text-decoration: none;
+}#sk-container-id-8 a.estimator_doc_link.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-3);
 }
-</style><div id="sk-container-id-36" class="sk-top-container" style="overflow: auto;"><div class="sk-text-repr-fallback"><pre>Pipeline(steps=[(&#x27;lemmatizer&#x27;,FunctionTransformer(func=&lt;function lemmatize_X at 0x7f7a77c96550&gt;)),(&#x27;tfidf&#x27;,TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;i&#x27;, &#x27;,&#x27;, &#x27;you&#x27;, &#x27;(&#x27;, &#x27;it&#x27;, &#x27;\\&#x27;,&#x27;*&#x27;, &#x27;that&#x27;, &#x27;do&#x27;, &#x27;needn&#x27;,&#x27;doesn&#x27;, &#x27;won&#x27;, &#x27;which&#x27;, &#x27;been&#x27;,&#x27;aren&#x27;, &#x27;more&#x27;, &#x27;while&#x27;, &#x27;until&#x27;,&#x27;hadn&#x27;, &#x27;^&#x27;, &#x27;was&#x27;, &#x27;=&#x27;, &#x27;their&#x27;,&#x27;o&#x27;, &#x27;are&#x27;, &#x27;by&#x27;, &quot;don&#x27;t&quot;, &#x27;ours&#x27;,&#x27;yourself&#x27;, &#x27;ma&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7f7b459159d0&gt;)),(&#x27;rf&#x27;,RandomForestClassifier(bootstrap=False, max_features=0.35,min_samples_leaf=4, min_samples_split=7,n_estimators=155))])</pre><b>In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook. <br />On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.</b></div><div class="sk-container" hidden><div class="sk-item sk-dashed-wrapped"><div class="sk-label-container"><div class="sk-label fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-83" type="checkbox" ><label for="sk-estimator-id-83" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>Pipeline</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.pipeline.Pipeline.html">?<span>Documentation for Pipeline</span></a><span class="sk-estimator-doc-link fitted">i<span>Fitted</span></span></div></label><div class="sk-toggleable__content fitted"><pre>Pipeline(steps=[(&#x27;lemmatizer&#x27;,FunctionTransformer(func=&lt;function lemmatize_X at 0x7f7a77c96550&gt;)),(&#x27;tfidf&#x27;,TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;i&#x27;, &#x27;,&#x27;, &#x27;you&#x27;, &#x27;(&#x27;, &#x27;it&#x27;, &#x27;\\&#x27;,&#x27;*&#x27;, &#x27;that&#x27;, &#x27;do&#x27;, &#x27;needn&#x27;,&#x27;doesn&#x27;, &#x27;won&#x27;, &#x27;which&#x27;, &#x27;been&#x27;,&#x27;aren&#x27;, &#x27;more&#x27;, &#x27;while&#x27;, &#x27;until&#x27;,&#x27;hadn&#x27;, &#x27;^&#x27;, &#x27;was&#x27;, &#x27;=&#x27;, &#x27;their&#x27;,&#x27;o&#x27;, &#x27;are&#x27;, &#x27;by&#x27;, &quot;don&#x27;t&quot;, &#x27;ours&#x27;,&#x27;yourself&#x27;, &#x27;ma&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7f7b459159d0&gt;)),(&#x27;rf&#x27;,RandomForestClassifier(bootstrap=False, max_features=0.35,min_samples_leaf=4, min_samples_split=7,n_estimators=155))])</pre></div> </div></div><div class="sk-serial"><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-84" type="checkbox" ><label for="sk-estimator-id-84" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>lemmatize_X</div><div class="caption">FunctionTransformer</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.preprocessing.FunctionTransformer.html">?<span>Documentation for FunctionTransformer</span></a></div></label><div class="sk-toggleable__content fitted"><pre>FunctionTransformer(func=&lt;function lemmatize_X at 0x7f7a77c96550&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-85" type="checkbox" ><label for="sk-estimator-id-85" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>TfidfVectorizer</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html">?<span>Documentation for TfidfVectorizer</span></a></div></label><div class="sk-toggleable__content fitted"><pre>TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;i&#x27;, &#x27;,&#x27;, &#x27;you&#x27;, &#x27;(&#x27;, &#x27;it&#x27;, &#x27;\\&#x27;, &#x27;*&#x27;, &#x27;that&#x27;, &#x27;do&#x27;,&#x27;needn&#x27;, &#x27;doesn&#x27;, &#x27;won&#x27;, &#x27;which&#x27;, &#x27;been&#x27;, &#x27;aren&#x27;,&#x27;more&#x27;, &#x27;while&#x27;, &#x27;until&#x27;, &#x27;hadn&#x27;, &#x27;^&#x27;, &#x27;was&#x27;, &#x27;=&#x27;,&#x27;their&#x27;, &#x27;o&#x27;, &#x27;are&#x27;, &#x27;by&#x27;, &quot;don&#x27;t&quot;, &#x27;ours&#x27;,&#x27;yourself&#x27;, &#x27;ma&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7f7b459159d0&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-86" type="checkbox" ><label for="sk-estimator-id-86" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>RandomForestClassifier</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.ensemble.RandomForestClassifier.html">?<span>Documentation for RandomForestClassifier</span></a></div></label><div class="sk-toggleable__content fitted"><pre>RandomForestClassifier(bootstrap=False, max_features=0.35, min_samples_leaf=4,min_samples_split=7, n_estimators=155)</pre></div> </div></div></div></div></div></div>
+</style><div id="sk-container-id-8" class="sk-top-container" style="overflow: auto;"><div class="sk-text-repr-fallback"><pre>Pipeline(steps=[(&#x27;lemmatizer&#x27;,FunctionTransformer(func=&lt;function lemmatize_X at 0x7fb4a5fb33a0&gt;)),(&#x27;tfidf&#x27;,TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;just&#x27;, &#x27;himself&#x27;, &#x27;most&#x27;, &#x27;&quot;&#x27;,&#x27;|&#x27;, &#x27;where&#x27;, &#x27;didn&#x27;, &#x27;with&#x27;, &#x27;(&#x27;,&#x27;at&#x27;, &#x27;once&#x27;, &#x27;she&#x27;, &#x27;do&#x27;, &#x27;below&#x27;,&#x27;y&#x27;, &#x27;having&#x27;, &#x27;about&#x27;, &#x27;^&#x27;, &#x27;)&#x27;,&#x27;@&#x27;, &#x27;theirs&#x27;, &quot;wasn&#x27;t&quot;, &#x27;the&#x27;,&#x27;wouldn&#x27;, &#x27;for&#x27;, &#x27;after&#x27;, &#x27;to&#x27;,&quot;you&#x27;ll&quot;, &#x27;;&#x27;, &#x27;over&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7fb4a5fb31f0&gt;)),(&#x27;rf&#x27;, RandomForestClassifier())])</pre><b>In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook. <br />On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.</b></div><div class="sk-container" hidden><div class="sk-item sk-dashed-wrapped"><div class="sk-label-container"><div class="sk-label fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-8" type="checkbox" ><label for="sk-estimator-id-8" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>Pipeline</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.pipeline.Pipeline.html">?<span>Documentation for Pipeline</span></a><span class="sk-estimator-doc-link fitted">i<span>Fitted</span></span></div></label><div class="sk-toggleable__content fitted"><pre>Pipeline(steps=[(&#x27;lemmatizer&#x27;,FunctionTransformer(func=&lt;function lemmatize_X at 0x7fb4a5fb33a0&gt;)),(&#x27;tfidf&#x27;,TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;just&#x27;, &#x27;himself&#x27;, &#x27;most&#x27;, &#x27;&quot;&#x27;,&#x27;|&#x27;, &#x27;where&#x27;, &#x27;didn&#x27;, &#x27;with&#x27;, &#x27;(&#x27;,&#x27;at&#x27;, &#x27;once&#x27;, &#x27;she&#x27;, &#x27;do&#x27;, &#x27;below&#x27;,&#x27;y&#x27;, &#x27;having&#x27;, &#x27;about&#x27;, &#x27;^&#x27;, &#x27;)&#x27;,&#x27;@&#x27;, &#x27;theirs&#x27;, &quot;wasn&#x27;t&quot;, &#x27;the&#x27;,&#x27;wouldn&#x27;, &#x27;for&#x27;, &#x27;after&#x27;, &#x27;to&#x27;,&quot;you&#x27;ll&quot;, &#x27;;&#x27;, &#x27;over&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7fb4a5fb31f0&gt;)),(&#x27;rf&#x27;, RandomForestClassifier())])</pre></div> </div></div><div class="sk-serial"><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-9" type="checkbox" ><label for="sk-estimator-id-9" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>lemmatize_X</div><div class="caption">FunctionTransformer</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.preprocessing.FunctionTransformer.html">?<span>Documentation for FunctionTransformer</span></a></div></label><div class="sk-toggleable__content fitted"><pre>FunctionTransformer(func=&lt;function lemmatize_X at 0x7fb4a5fb33a0&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-10" type="checkbox" ><label for="sk-estimator-id-10" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>TfidfVectorizer</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html">?<span>Documentation for TfidfVectorizer</span></a></div></label><div class="sk-toggleable__content fitted"><pre>TfidfVectorizer(max_df=0.95, min_df=2,stop_words=[&#x27;just&#x27;, &#x27;himself&#x27;, &#x27;most&#x27;, &#x27;&quot;&#x27;, &#x27;|&#x27;, &#x27;where&#x27;,&#x27;didn&#x27;, &#x27;with&#x27;, &#x27;(&#x27;, &#x27;at&#x27;, &#x27;once&#x27;, &#x27;she&#x27;, &#x27;do&#x27;,&#x27;below&#x27;, &#x27;y&#x27;, &#x27;having&#x27;, &#x27;about&#x27;, &#x27;^&#x27;, &#x27;)&#x27;, &#x27;@&#x27;,&#x27;theirs&#x27;, &quot;wasn&#x27;t&quot;, &#x27;the&#x27;, &#x27;wouldn&#x27;, &#x27;for&#x27;, &#x27;after&#x27;,&#x27;to&#x27;, &quot;you&#x27;ll&quot;, &#x27;;&#x27;, &#x27;over&#x27;, ...],tokenizer=&lt;function tokenize_quote at 0x7fb4a5fb31f0&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-11" type="checkbox" ><label for="sk-estimator-id-11" class="sk-toggleable__label fitted sk-toggleable__label-arrow"><div><div>RandomForestClassifier</div></div><div><a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.6/modules/generated/sklearn.ensemble.RandomForestClassifier.html">?<span>Documentation for RandomForestClassifier</span></a></div></label><div class="sk-toggleable__content fitted"><pre>RandomForestClassifier()</pre></div> </div></div></div></div></div></div>
 
 ## Evaluation Results
 
-| Metric   |   Value |
-|----------|---------|
-| accuracy |  0.8105 |
-| f1 score |  0.8105 |
+| Metric   |    Value |
+|----------|----------|
+| accuracy | 0.867925 |
+| f1 score | 0.867925 |
 
 # How to Get Started with the Model