Webhooks don't find any patterns #401 (#404)

6 years ago · 6d5ec2b6fe
7 changed files with 161 additions and 46 deletions
--- a/analytics/analytics/models/drop_model.py
+++ b/analytics/analytics/models/drop_model.py
@ -14,9 +14,9 @@ class DropModel(Model):
    def __init__(self):
        super()
        self.segments = []
-        self.idrops = []
-        self.model_drop = []
        self.state = {
+            'idrops': [],
+            'model_drop': [],
            'confidence': 1.5,
            'convolve_max': 200,
            'convolve_min': 200,
@ -42,10 +42,10 @@ class DropModel(Model):
        data = utils.cut_dataframe(dataframe)
        data = data['value']
        window_size = self.state['WINDOW_SIZE']
-        self.idrops = learning_info['segment_center_list']
-        self.model_drop = utils.get_av_model(learning_info['patterns_list'])
-        convolve_list = utils.get_convolve(self.idrops, self.model_drop, data, window_size)
-        correlation_list = utils.get_correlation(self.idrops, self.model_drop, data, window_size)
+        self.state['idrops'] = learning_info['segment_center_list']
+        self.state['model_drop'] = utils.get_av_model(learning_info['patterns_list'])
+        convolve_list = utils.get_convolve(self.state['idrops'], self.state['model_drop'], data, window_size)
+        correlation_list = utils.get_correlation(self.state['idrops'], self.state['model_drop'], data, window_size)

        del_conv_list = []
        delete_pattern_timestamp = []
@ -54,7 +54,7 @@ class DropModel(Model):
            delete_pattern_timestamp.append(segment.pattern_timestamp)
            deleted_drop = utils.get_interval(data, segment_cent_index, window_size)
            deleted_drop = utils.subtract_min_without_nan(deleted_drop)
-            del_conv_drop = scipy.signal.fftconvolve(deleted_drop, self.model_drop)
+            del_conv_drop = scipy.signal.fftconvolve(deleted_drop, self.state['model_drop'])
            if len(del_conv_drop): del_conv_list.append(max(del_conv_drop))

        self._update_fiting_result(self.state, learning_info['confidence'], convolve_list, del_conv_list)
@ -73,10 +73,10 @@ class DropModel(Model):
        variance_error = self.state['WINDOW_SIZE']
        close_patterns = utils.close_filtering(segments, variance_error)
        segments = utils.best_pattern(close_patterns, data, 'min')
-        if len(segments) == 0 or len(self.idrops) == 0 :
+        if len(segments) == 0 or len(self.state['idrops']) == 0 :
            segments = []
            return segments
-        pattern_data = self.model_drop
+        pattern_data = self.state['model_drop']
        for segment in segments:
            if segment > self.state['WINDOW_SIZE'] and segment < (len(data) - self.state['WINDOW_SIZE']):
                convol_data = utils.get_interval(data, segment, self.state['WINDOW_SIZE'])
--- a/analytics/analytics/models/general_model.py
+++ b/analytics/analytics/models/general_model.py
@ -15,10 +15,9 @@ class GeneralModel(Model):

    def __init__(self):
        super()
-        self.segments = []
-        self.ipats = []
-        self.model_gen = []
        self.state = {
+            'ipats': [],
+            'model_gen': [],
            'convolve_max': 240,
            'convolve_min': 200,
            'WINDOW_SIZE': 240,
@ -41,10 +40,10 @@ class GeneralModel(Model):
    def do_fit(self, dataframe: pd.DataFrame, labeled_segments: list, deleted_segments: list, learning_info: dict) -> None:
        data = utils.cut_dataframe(dataframe)
        data = data['value']
-        self.ipats = learning_info['segment_center_list']
-        self.model_gen = utils.get_av_model(learning_info['patterns_list'])
-        convolve_list = utils.get_convolve(self.ipats, self.model_gen, data, self.state['WINDOW_SIZE'])
-        correlation_list = utils.get_correlation(self.ipats, self.model_gen, data, self.state['WINDOW_SIZE'])
+        self.state['ipats'] = learning_info['segment_center_list']
+        self.state['model_gen'] = utils.get_av_model(learning_info['patterns_list'])
+        convolve_list = utils.get_convolve(self.state['ipats'], self.state['model_gen'], data, self.state['WINDOW_SIZE'])
+        correlation_list = utils.get_correlation(self.state['ipats'], self.state['model_gen'], data, self.state['WINDOW_SIZE'])

        del_conv_list = []
        delete_pattern_timestamp = []
@ -53,7 +52,7 @@ class GeneralModel(Model):
            delete_pattern_timestamp.append(segment.pattern_timestamp)
            deleted_pat = utils.get_interval(data, del_mid_index, self.state['WINDOW_SIZE'])
            deleted_pat = utils.subtract_min_without_nan(deleted_pat)
-            del_conv_pat = scipy.signal.fftconvolve(deleted_pat, self.model_gen)
+            del_conv_pat = scipy.signal.fftconvolve(deleted_pat, self.state['model_gen'])
            if len(del_conv_pat): del_conv_list.append(max(del_conv_pat))

        self.state['convolve_min'], self.state['convolve_max'] = utils.get_min_max(convolve_list, self.state['WINDOW_SIZE'] / 3)
@ -62,7 +61,7 @@ class GeneralModel(Model):
    def do_detect(self, dataframe: pd.DataFrame) -> list:
        data = utils.cut_dataframe(dataframe)
        data = data['value']
-        pat_data = self.model_gen
+        pat_data = self.state['model_gen']
        if pat_data.count(0) == len(pat_data):
            raise ValueError('Labeled patterns must not be empty')

@ -78,7 +77,7 @@ class GeneralModel(Model):
        return set(item + self.state['WINDOW_SIZE'] for item in filtered)

    def __filter_detection(self, segments: list, data: list):
-        if len(segments) == 0 or len(self.ipats) == 0:
+        if len(segments) == 0 or len(self.state['ipats']) == 0:
            return []
        delete_list = []
        for val in segments:
--- a/analytics/analytics/models/jump_model.py
+++ b/analytics/analytics/models/jump_model.py
@ -15,9 +15,9 @@ class JumpModel(Model):
    def __init__(self):
        super()
        self.segments = []
-        self.ijumps = []
-        self.model_jump = []
        self.state = {
+            'ijumps': [],
+            'model_jump': [],
            'confidence': 1.5,
            'convolve_max': 230,
            'convolve_min': 230,
@ -43,10 +43,10 @@ class JumpModel(Model):
        data = utils.cut_dataframe(dataframe)
        data = data['value']
        window_size = self.state['WINDOW_SIZE']
-        self.ijumps = learning_info['segment_center_list']
-        self.model_jump = utils.get_av_model(learning_info['patterns_list'])
-        convolve_list = utils.get_convolve(self.ijumps, self.model_jump, data, window_size)
-        correlation_list = utils.get_correlation(self.ijumps, self.model_jump, data, window_size)
+        self.state['ijumps'] = learning_info['segment_center_list']
+        self.state['model_jump'] = utils.get_av_model(learning_info['patterns_list'])
+        convolve_list = utils.get_convolve(self.state['ijumps'], self.state['model_jump'], data, window_size)
+        correlation_list = utils.get_correlation(self.state['ijumps'], self.state['model_jump'], data, window_size)

        del_conv_list = []
        delete_pattern_timestamp = []
@ -55,7 +55,7 @@ class JumpModel(Model):
            delete_pattern_timestamp.append(segment.pattern_timestamp)
            deleted_jump = utils.get_interval(data, segment_cent_index, window_size)
            deleted_jump = utils.subtract_min_without_nan(deleted_jump)
-            del_conv_jump = scipy.signal.fftconvolve(deleted_jump, self.model_jump)
+            del_conv_jump = scipy.signal.fftconvolve(deleted_jump, self.state['model_jump'])
            if len(del_conv_jump): del_conv_list.append(max(del_conv_jump))

        self._update_fiting_result(self.state, learning_info['confidence'], convolve_list, del_conv_list)
@ -75,10 +75,10 @@ class JumpModel(Model):
        close_patterns = utils.close_filtering(segments, variance_error)
        segments = utils.best_pattern(close_patterns, data, 'max')

-        if len(segments) == 0 or len(self.ijumps) == 0 :
+        if len(segments) == 0 or len(self.state['ijumps']) == 0 :
            segments = []
            return segments
-        pattern_data = self.model_jump
+        pattern_data = self.state['model_jump']
        upper_bound = self.state['convolve_max'] * 1.2
        lower_bound = self.state['convolve_min'] * 0.8
        delete_up_bound = self.state['conv_del_max'] * 1.02
--- a/analytics/analytics/models/peak_model.py
+++ b/analytics/analytics/models/peak_model.py
@ -16,9 +16,9 @@ class PeakModel(Model):
    def __init__(self):
        super()
        self.segments = []
-        self.ipeaks = []
-        self.model = []
        self.state = {
+            'ipeaks': [],
+            'model_peak': [],
            'confidence': 1.5,
            'convolve_max': 570000,
            'convolve_min': 530000,
@ -41,10 +41,10 @@ class PeakModel(Model):
        data = utils.cut_dataframe(dataframe)
        data = data['value']
        window_size = self.state['WINDOW_SIZE']
-        self.ipeaks = learning_info['segment_center_list']
-        self.model = utils.get_av_model(learning_info['patterns_list'])
-        convolve_list = utils.get_convolve(self.ipeaks, self.model, data, window_size)
-        correlation_list = utils.get_correlation(self.ipeaks, self.model, data, window_size)
+        self.state['ipeaks'] = learning_info['segment_center_list']
+        self.state['model_peak'] = utils.get_av_model(learning_info['patterns_list'])
+        convolve_list = utils.get_convolve(self.state['ipeaks'], self.state['model_peak'], data, window_size)
+        correlation_list = utils.get_correlation(self.state['ipeaks'], self.state['model_peak'], data, window_size)

        del_conv_list = []
        delete_pattern_width = []
@ -55,7 +55,7 @@ class PeakModel(Model):
            delete_pattern_timestamp.append(segment.pattern_timestamp)
            deleted = utils.get_interval(data, del_max_index, window_size)
            deleted = utils.subtract_min_without_nan(deleted)
-            del_conv = scipy.signal.fftconvolve(deleted, self.model)
+            del_conv = scipy.signal.fftconvolve(deleted, self.state['model_peak'])
            if len(del_conv): del_conv_list.append(max(del_conv))
            delete_pattern_height.append(utils.find_confidence(deleted)[1])
            delete_pattern_width.append(utils.find_width(deleted, True))
@ -85,9 +85,9 @@ class PeakModel(Model):
        close_patterns = utils.close_filtering(segments, variance_error)
        segments = utils.best_pattern(close_patterns, data, 'max')

-        if len(segments) == 0 or len(self.ipeaks) == 0:
+        if len(segments) == 0 or len(self.state['ipeaks']) == 0:
            return []
-        pattern_data = self.model
+        pattern_data = self.state['model_peak']
        for segment in segments:
            if segment > self.state['WINDOW_SIZE']:
                convol_data = utils.get_interval(data, segment, self.state['WINDOW_SIZE'])
--- a/analytics/analytics/models/trough_model.py
+++ b/analytics/analytics/models/trough_model.py
@ -16,9 +16,9 @@ class TroughModel(Model):
    def __init__(self):
        super()
        self.segments = []
-        self.itroughs = []
-        self.model = []
        self.state = {
+            'itroughs': [],
+            'model_trough': [],
            'confidence': 1.5,
            'convolve_max': 570000,
            'convolve_min': 530000,
@ -41,10 +41,10 @@ class TroughModel(Model):
        data = utils.cut_dataframe(dataframe)
        data = data['value']
        window_size = self.state['WINDOW_SIZE']
-        self.itroughs = learning_info['segment_center_list']
-        self.model = utils.get_av_model(learning_info['patterns_list'])
-        convolve_list = utils.get_convolve(self.itroughs, self.model, data, window_size)
-        correlation_list = utils.get_correlation(self.itroughs, self.model, data, window_size)
+        self.state['itroughs'] = learning_info['segment_center_list']
+        self.state['model_trough'] = utils.get_av_model(learning_info['patterns_list'])
+        convolve_list = utils.get_convolve(self.state['itroughs'], self.state['model_trough'], data, window_size)
+        correlation_list = utils.get_correlation(self.state['itroughs'], self.state['model_trough'], data, window_size)

        del_conv_list = []
        delete_pattern_width = []
@ -55,7 +55,7 @@ class TroughModel(Model):
            delete_pattern_timestamp.append(segment.pattern_timestamp)
            deleted = utils.get_interval(data, del_min_index, window_size)
            deleted = utils.subtract_min_without_nan(deleted)
-            del_conv = scipy.signal.fftconvolve(deleted, self.model)
+            del_conv = scipy.signal.fftconvolve(deleted, self.state['model_trough'])
            if len(del_conv): del_conv_list.append(max(del_conv))
            delete_pattern_height.append(utils.find_confidence(deleted)[1])
            delete_pattern_width.append(utils.find_width(deleted, False))
@ -84,10 +84,10 @@ class TroughModel(Model):
        variance_error = self.state['WINDOW_SIZE']
        close_patterns = utils.close_filtering(segments, variance_error)
        segments = utils.best_pattern(close_patterns, data, 'min')
-        if len(segments) == 0 or len(self.itroughs) == 0 :
+        if len(segments) == 0 or len(self.state['itroughs']) == 0 :
            segments = []
            return segments
-        pattern_data = self.model
+        pattern_data = self.state['model_trough']
        for segment in segments:
            if segment > self.state['WINDOW_SIZE']:
                convol_data = utils.get_interval(data, segment, self.state['WINDOW_SIZE'])
--- a/analytics/requirements.txt
+++ b/analytics/requirements.txt
@ -1,5 +1,6 @@
 altgraph==0.15
 attrdict==2.0.0
+aiounittest==1.1.0
 future==0.16.0
 macholib==1.9
 numpy==1.14.5
--- a/analytics/tests/test_manager.py
+++ b/analytics/tests/test_manager.py
@ -0,0 +1,115 @@
+from models import PeakModel, DropModel, TroughModel, JumpModel, GeneralModel
+
+import aiounittest
+from analytic_unit_manager import AnalyticUnitManager
+from collections import namedtuple
+
+TestData = namedtuple('TestData', ['uid', 'type', 'values', 'segments'])
+
+def get_random_id() -> str:
+    return str(id(list()))
+
+class TestDataset(aiounittest.AsyncTestCase):
+
+    timestep = 50 #ms
+
+    def _fill_task(self, uid, data, task_type, analytic_unit_type, segments=None, cache=None):
+        task = {
+            'analyticUnitId': uid,
+            'type': task_type,
+            'payload': {
+                'data': data,
+                'from': data[0][0],
+                'to': data[-1][0],
+                'analyticUnitType': analytic_unit_type,
+                'detector': 'pattern',
+                'cache': cache
+            },
+            '_id': get_random_id()
+        }
+        if segments: task['payload']['segments'] = segments
+
+        return task
+
+    def _convert_values(self, values) -> list:
+        from_t = 0
+        to_t = len(values) * self.timestep
+        return list(zip(range(from_t, to_t, self.timestep), values))
+
+    def _index_to_test_time(self, idx) -> int:
+        return idx * self.timestep
+
+    def _get_learn_task(self, test_data):
+        uid, analytic_unit_type, values, segments = test_data
+        data = self._convert_values(values)
+        segments = [{
+            'analyticUnitId': uid,
+            'from': self._index_to_test_time(s[0]),
+            'to': self._index_to_test_time(s[1]),
+            'labeled': True,
+            'deleted': False
+        } for s in segments]
+        return self._fill_task(uid, data, 'LEARN', analytic_unit_type, segments=segments)
+
+    def _get_detect_task(self, test_data, cache):
+        uid, analytic_unit_type, values, _ = test_data
+        data = self._convert_values(values)
+        return self._fill_task(uid, data, 'DETECT', analytic_unit_type, cache=cache)
+
+    def _get_test_dataset(self, pattern) -> tuple:
+        """
+        pattern name: ([dataset values], [list of segments])
+
+        segment - (begin, end) - indexes in dataset values
+        returns dataset in format (data: List[int], segments: List[List[int]])
+        """
+        datasets = {
+            'PEAK': ([0, 0, 1, 2, 3, 4, 3, 2, 1, 0, 0], [[2, 8]]),
+            'JUMP': ([0, 0, 1, 2, 3, 4, 4, 4], [[1, 6]]),
+            'DROP': ([4, 4, 4, 3, 2, 1, 0, 0], [[1, 6]]),
+            'TROUGH': ([4, 4, 3, 2, 1, 0, 1, 2, 3, 4, 4], [[1, 9]]),
+            'GENERAL': ([0, 0, 1, 2, 3, 4, 3, 2, 1, 0, 0], [[2, 8]])
+        }
+        return datasets[pattern]
+
+    async def _learn(self, task, manager=None) -> dict:
+        if not manager: manager = AnalyticUnitManager()
+        result = await manager.handle_analytic_task(task)
+        return result['payload']['cache']
+
+    async def _detect(self, task, manager=None) -> dict:
+        if not manager: manager = AnalyticUnitManager()
+        result = await manager.handle_analytic_task(task)
+        return result
+
+    async def _test_detect(self, test_data, manager=None):
+        learn_task = self._get_learn_task(test_data)
+        cache = await self._learn(learn_task, manager)
+        detect_task = self._get_detect_task(test_data, cache)
+        result = await self._detect(detect_task, manager)
+        return result
+
+    async def test_unit_manager(self):
+        test_data = TestData(get_random_id(), 'PEAK', [0,1,2,5,10,5,2,1,1,1,0,0,0,0], [[1,7]])
+        manager = AnalyticUnitManager()
+
+        with_manager = await self._test_detect(test_data, manager)
+        without_manager = await self._test_detect(test_data)
+        self.assertEqual(with_manager, without_manager)
+
+    async def test_cache(self):
+        cache_attrs = {
+            'PEAK': PeakModel().state.keys(),
+            'JUMP': JumpModel().state.keys(),
+            'DROP': DropModel().state.keys(),
+            'TROUGH': TroughModel().state.keys(),
+            'GENERAL': GeneralModel().state.keys()
+        }
+
+        for pattern, attrs in cache_attrs.items():
+            test_data = TestData(get_random_id(), pattern, *self._get_test_dataset(pattern))
+            learn_task = self._get_learn_task(test_data)
+            cache = await self._learn(learn_task)
+
+            for a in attrs:
+                self.assertTrue(a in cache.keys(), msg='{} not in cache keys: {}'.format(a, cache.keys()))