Spaces:

rootstrap-org
/

wordle-solver

Sleeping

App Files Files Community

santit96 commited on Jan 27, 2023

Commit

b8d0d32

1 Parent(s): 79febd9

Fix env tests

Browse files

Files changed (2) hide show

wordle_env/__init__.py +3 -0
wordle_env/test_wordle.py +16 -27

wordle_env/__init__.py CHANGED Viewed

@@ -7,6 +7,9 @@ from gym.envs.registration import (
 )
 import os
 from . import wordle
 register(

 )
 import os
 from . import wordle
+# Classic
+# ----------------------------------------
+current_dir =  os.path.realpath(os.path.dirname(__file__))
 register(

wordle_env/test_wordle.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import pytest
-import wordle
-import state
 TESTWORDS = [
     "APPAA",
@@ -50,14 +50,12 @@ def test_guess_win(wordleEnv):
 def test_win_reward(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
-    word_index = (wordleEnv.words.index(
-        wordleEnv.decode_word(goal)) + 1) % len(wordleEnv.words)
-    new_state, reward, done, _ = wordleEnv.step(
-        wordleEnv.encode_word(wordleEnv.words[word_index]))
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-1
     assert not done
     assert not wordleEnv.done
-    assert reward == 0
     new_state, reward, done, _ = wordleEnv.step(goal)
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-2
@@ -75,9 +73,7 @@ def test_win_reward(wordleEnv):
 def test_win_reward_6(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
-    word_index = (wordleEnv.words.index(
-        wordleEnv.decode_word(goal)) + 1) % len(wordleEnv.words)
-    random_word = wordleEnv.encode_word(wordleEnv.words[word_index])
     for i in range(5):
         new_state, reward, done, _ = wordleEnv.step(random_word)
@@ -93,24 +89,21 @@ def test_win_reward_6(wordleEnv):
 def test_lose_reward(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
-    word_index = (wordleEnv.words.index(
-        wordleEnv.decode_word(goal)) + 1) % len(wordleEnv.words)
-    random_word = wordleEnv.encode_word(wordleEnv.words[word_index])
     for i in range(1, wordleEnv.max_turns):
         new_state, reward, done, _ = wordleEnv.step(random_word)
         assert state.remaining_steps(new_state) == wordleEnv.max_turns-i
         assert not done
         assert not wordleEnv.done
-        assert reward == 0
-    word_index = (wordleEnv.words.index(wordleEnv.decode_word(
-        goal)) + wordleEnv.max_turns) % len(wordleEnv.words)
-    random_word = wordleEnv.encode_word(wordleEnv.words[word_index])
     new_state, reward, done, _ = wordleEnv.step(random_word)
     assert state.remaining_steps(new_state) == 0
     assert done
     assert wordleEnv.done
-    assert reward == -wordle.REWARD
     try:
         wordleEnv.step(goal)
@@ -121,11 +114,10 @@ def test_lose_reward(wordleEnv):
 def test_step(wordleEnv):
     wordleEnv.reset(seed=13)
-    wordleEnv.set_goal_encoded(wordleEnv.encode_word(wordleEnv.words[0]))
     cur_state = wordleEnv.state
-    new_state, reward, done, _ = wordleEnv.step(
-        wordleEnv.encode_word(wordleEnv.words[1]))
     assert state.remaining_steps(cur_state) == wordleEnv.max_turns
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-1
     # Expect B to be all 1,0,0
@@ -156,8 +148,7 @@ def test_step(wordleEnv):
                                                   1, 0, 0,
                                                   0, 0, 0)
     cur_state = wordleEnv.state
-    new_state, reward, done, _ = wordleEnv.step(
-        wordleEnv.encode_word(wordleEnv.words[1]))
     assert state.remaining_steps(cur_state) == wordleEnv.max_turns-1
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-2
     # Expect B to be all 1,0,0
@@ -180,8 +171,7 @@ def test_step(wordleEnv):
                                                   1, 0, 0,
                                                   0, 0, 0)
-    new_state, reward, done, _ = wordleEnv.step(
-        wordleEnv.encode_word(wordleEnv.words[2]))
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-3
     # Expect B to be all 1,0,0
     offset = 1 + 3*5*(ord('B')-ord('A'))
@@ -207,8 +197,7 @@ def test_step(wordleEnv):
                                                   1, 0, 0,
                                                   0, 0, 0)
-    new_state, reward, done, _ = wordleEnv.step(
-        wordleEnv.encode_word(wordleEnv.words[0]))
     # Expect A to be right in position 0 4 and 5
     offset = 1
     assert tuple(new_state[offset:offset+15]) == (0, 0, 1,

 import pytest
+from . import wordle
+from . import state
 TESTWORDS = [
     "APPAA",
 def test_win_reward(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
+    word_index = (goal + 1) % len(wordleEnv.words)
+    new_state, reward, done, _ = wordleEnv.step(word_index)
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-1
     assert not done
     assert not wordleEnv.done
+    assert reward < 1
     new_state, reward, done, _ = wordleEnv.step(goal)
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-2
 def test_win_reward_6(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
+    random_word = (goal + 1) % len(wordleEnv.words)
     for i in range(5):
         new_state, reward, done, _ = wordleEnv.step(random_word)
 def test_lose_reward(wordleEnv):
     wordleEnv.reset(seed=13)
     goal = wordleEnv.goal_word
+    random_word = (goal + 1) % len(wordleEnv.words)
     for i in range(1, wordleEnv.max_turns):
         new_state, reward, done, _ = wordleEnv.step(random_word)
         assert state.remaining_steps(new_state) == wordleEnv.max_turns-i
         assert not done
         assert not wordleEnv.done
+        assert reward < 1
+    word_index = (goal + wordleEnv.max_turns) % len(wordleEnv.words)
+    random_word = word_index
     new_state, reward, done, _ = wordleEnv.step(random_word)
     assert state.remaining_steps(new_state) == 0
     assert done
     assert wordleEnv.done
+    assert reward < -wordle.REWARD + 1
     try:
         wordleEnv.step(goal)
 def test_step(wordleEnv):
     wordleEnv.reset(seed=13)
+    wordleEnv.set_goal_encoded(0)
     cur_state = wordleEnv.state
+    new_state, reward, done, _ = wordleEnv.step(1)
     assert state.remaining_steps(cur_state) == wordleEnv.max_turns
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-1
     # Expect B to be all 1,0,0
                                                   1, 0, 0,
                                                   0, 0, 0)
     cur_state = wordleEnv.state
+    new_state, reward, done, _ = wordleEnv.step(1)
     assert state.remaining_steps(cur_state) == wordleEnv.max_turns-1
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-2
     # Expect B to be all 1,0,0
                                                   1, 0, 0,
                                                   0, 0, 0)
+    new_state, reward, done, _ = wordleEnv.step(2)
     assert state.remaining_steps(new_state) == wordleEnv.max_turns-3
     # Expect B to be all 1,0,0
     offset = 1 + 3*5*(ord('B')-ord('A'))
                                                   1, 0, 0,
                                                   0, 0, 0)
+    new_state, reward, done, _ = wordleEnv.step(0)
     # Expect A to be right in position 0 4 and 5
     offset = 1
     assert tuple(new_state[offset:offset+15]) == (0, 0, 1,