cache stoi/itos

vpj · vpj · commit 0492112b0e30 · 2020-12-31T09:38:59.000+05:30
diff --git a/notebooks/evaluate.ipynb b/notebooks/evaluate.ipynb
@@ -6,19 +6,20 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "from labml import experiment\n",
-    "from python_autocomplete.train import Configs\n",
-    "from python_autocomplete.evaluate import evaluate, anomalies, complete, Predictor\n",
+    "import string\n",
+    "\n",
     "import torch\n",
-    "import torch.nn\n",
+    "from torch import nn\n",
+    "\n",
     "from labml import experiment, logger, lab\n",
     "from labml_helpers.module import Module\n",
     "from labml.logger import Text, Style\n",
     "from labml.utils.pytorch import get_modules\n",
-    "from torch import nn\n",
-    "import string\n",
+    "from labml.utils.cache import cache\n",
+    "from labml_helpers.datasets.text import TextDataset\n",
     "\n",
-    "from labml_helpers.datasets.text import TextDataset"
+    "from python_autocomplete.train import Configs\n",
+    "from python_autocomplete.evaluate import evaluate, anomalies, complete, Predictor"
    ]
   },
   {
@@ -87,7 +88,8 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "conf_dict['device.cuda_device'] = 1"
+    "conf_dict['device.cuda_device'] = 1\n",
+    "# conf_dict['device.use_cuda'] = False"
    ]
   },
   {
@@ -121,26 +123,19 @@
      "data": {
       "text/html": [
        "<pre style=\"overflow-x: scroll;\">Prepare model...\n",
-       "  Prepare n_tokens...\n",
-       "    Prepare text...\n",
-       "      Prepare tokenizer<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t3.16ms</span>\n",
-       "      Load data<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t162.36ms</span>\n",
-       "      Tokenize<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t3,109.56ms</span>\n",
-       "      Build vocabulary<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t66.50ms</span>\n",
-       "    Prepare text<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t3,350.38ms</span>\n",
-       "  Prepare n_tokens<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t3,354.96ms</span>\n",
-       "  Prepare transformer<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t1.12ms</span>\n",
+       "  Prepare n_tokens<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t1.32ms</span>\n",
+       "  Prepare transformer<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t1.05ms</span>\n",
        "  Prepare encoder...\n",
        "    Prepare encoder_layer...\n",
-       "      Prepare encoder_attn<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t9.52ms</span>\n",
-       "      Prepare feed_forward<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t13.47ms</span>\n",
-       "    Prepare encoder_layer<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t28.71ms</span>\n",
-       "  Prepare encoder<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t47.43ms</span>\n",
-       "  Prepare src_embed<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t4.22ms</span>\n",
+       "      Prepare encoder_attn<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t12.84ms</span>\n",
+       "      Prepare feed_forward<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t12.51ms</span>\n",
+       "    Prepare encoder_layer<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t31.24ms</span>\n",
+       "  Prepare encoder<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t47.89ms</span>\n",
+       "  Prepare src_embed<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t5.40ms</span>\n",
        "  Prepare device...\n",
-       "    Prepare device_info<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t57.05ms</span>\n",
-       "  Prepare device<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t58.74ms</span>\n",
-       "Prepare model<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t4,815.99ms</span>\n",
+       "    Prepare device_info<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t37.79ms</span>\n",
+       "  Prepare device<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t39.82ms</span>\n",
+       "Prepare model<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t1,351.06ms</span>\n",
        "</pre>"
       ],
       "text/plain": [
@@ -175,10 +170,10 @@
      "data": {
       "text/html": [
        "<pre style=\"overflow-x: scroll;\">Selected <span style=\"color: #60C6C8\">experiment</span> = <strong>source_code</strong> <span style=\"color: #60C6C8\">run</span> = <strong>39b03a1e454011ebbaff2b26e3148b3d</strong> <span style=\"color: #60C6C8\">checkpoint</span> = <strong>351023104</strong>\n",
-       "Loading checkpoint<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t67.46ms</span>\n",
+       "Loading checkpoint<span style=\"color: #00A250\">...[DONE]</span><span style=\"color: #208FFB\">\t47.04ms</span>\n",
        "\n",
-       "<strong><span style=\"text-decoration: underline\">Notebook Experiment</span></strong>: <span style=\"color: #208FFB\">0c69f4444ab011ebb618517d0c553d3c</span>\n",
-       "\t[dirty]: <strong><span style=\"color: #DDB62B\">\"evaluate\"</span></strong>\n",
+       "<strong><span style=\"text-decoration: underline\">Notebook Experiment</span></strong>: <span style=\"color: #208FFB\">7f418b0e4b1d11eba0e89704bc602f06</span>\n",
+       "\t[dirty]: <strong><span style=\"color: #DDB62B\">\"rename notebook\"</span></strong>\n",
        "\tloaded from: <span style=\"color: #D160C4\">39b03a1e454011ebbaff2b26e3148b3d</span></pre>"
       ],
       "text/plain": [
@@ -191,7 +186,7 @@
     {
      "data": {
       "text/plain": [
-       "<labml.internal.experiment.watcher.ExperimentWatcher at 0x7fd68e67b370>"
+       "<labml.internal.experiment.watcher.ExperimentWatcher at 0x7f655c41a400>"
       ]
      },
      "execution_count": 9,
@@ -209,7 +204,7 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "p = Predictor(conf.model, conf.text.stoi, conf.text.itos)\n",
+    "p = Predictor(conf.model, cache('stoi', lambda: conf.text.stoi), cache('itos', lambda: conf.text.itos))\n",
     "_ = conf.model.eval()"
    ]
   },
@@ -235,16 +230,17 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 16,
+   "execution_count": 12,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "\"(LSTM\"\n",
-      "CPU times: user 386 ms, sys: 6.33 ms, total: 392 ms\n",
-      "Wall time: 41 ms\n"
+      "\"\n",
+      "        super\"\n",
+      "CPU times: user 950 ms, sys: 34.7 ms, total: 984 ms\n",
+      "Wall time: 254 ms\n"
      ]
     }
    ],
@@ -256,14 +252,14 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
+   "execution_count": 13,
    "metadata": {},
    "outputs": [
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "\",\"\n"
+      "\"(LSTM\"\n"
      ]
     }
    ],
@@ -275,7 +271,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 18,
+   "execution_count": 14,
    "metadata": {},
    "outputs": [
     {
@@ -299,7 +295,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": 15,
    "metadata": {},
    "outputs": [
     {
@@ -428,7 +424,7 @@
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "CPU times: user 2min 18s, sys: 1.17 s, total: 2min 19s\n",
+      "CPU times: user 1min 59s, sys: 62.9 ms, total: 1min 59s\n",
       "Wall time: 1min 23s\n"
      ]
     }
@@ -440,7 +436,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 20,
+   "execution_count": 16,
    "metadata": {},
    "outputs": [
     {
@@ -569,7 +565,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 21,
+   "execution_count": 17,
    "metadata": {},
    "outputs": [
     {
diff --git a/python_autocomplete/evaluate.py b/python_autocomplete/evaluate.py
@@ -3,9 +3,10 @@
 
 import torch
 import torch.nn
+from labml.utils.cache import cache
 from torch import nn
 
-from labml import experiment, logger
+from labml import experiment, logger, lab
 from labml.logger import Text, Style
 from labml.utils.pytorch import get_modules
 from labml_helpers.module import Module
@@ -191,16 +192,21 @@ def main():
     conf = Configs()
     experiment.evaluate()
 
-    run_uuid = '39b03a1e454011ebbaff2b26e3148b3d'
     # Replace this with your training experiment UUID
+    run_uuid = '39b03a1e454011ebbaff2b26e3148b3d'
+
     conf_dict = experiment.load_configs(run_uuid)
     experiment.configs(conf, conf_dict)
     experiment.add_pytorch_models(get_modules(conf))
     experiment.load(run_uuid)
 
     experiment.start()
-    predictor = Predictor(conf.model, conf.text.stoi, conf.text.itos)
-    evaluate(predictor, conf.text.valid[:1000])
+    predictor = Predictor(conf.model, cache('stoi', lambda: conf.text.stoi), cache('itos', lambda: conf.text.itos))
+    conf.model.eval()
+
+    with open(str(lab.get_data_path() / 'sample.py'), 'r') as f:
+        sample = f.read()
+    evaluate(predictor, sample)
 
 
 if __name__ == '__main__':
diff --git a/python_autocomplete/train.py b/python_autocomplete/train.py
@@ -133,7 +133,8 @@ def _loss_func(c: Configs):
 
 @option(Configs.n_tokens)
 def _n_tokens(c: Configs):
-    return c.text.n_tokens
+    from labml.utils.cache import cache
+    return cache('n_tokens', lambda: c.text.n_tokens)
 
 
 @option(Configs.model)
diff --git a/requirements.txt b/requirements.txt
@@ -2,4 +2,4 @@ labml>=0.4.74
 torch
 numpy
 labml-helpers>=0.4.70
-labml-nn>=0.4.83
+labml-nn>=0.4.86
diff --git a/setup.py b/setup.py
@@ -19,7 +19,7 @@
                                                'labml_nn', 'labml_nn.*',
                                                'labml', 'labml.*',
                                                'test', 'test.*')),
-    install_requires=['labml>=0.4.83',
+    install_requires=['labml>=0.4.86',
                       'labml_helpers>=0.4.70',
                       'labml_nn>=0.4.70'
                       'torch',