hastic-server/analytics/detectors/general_detector/general_detector.py

from detectors.general_detector.supervised_algorithm import SupervisedAlgorithm
from detectors import Detector
import utils
from data_preprocessor import data_preprocessor
import pandas as pd
import logging
from urllib.parse import urlparse
import config
import os.path
import json


NANOSECONDS_IN_MS = 1000000

logger = logging.getLogger('analytic_toolset')


class GeneralDetector(Detector):

    def __init__(self):
        self.model = None

    async def train(self, dataframe, segments):

        confidence = 0.02
        start_index, stop_index = 0, len(dataframe)
        if len(segments) > 0:
            confidence = 0.0
            min_time, max_time = utils.segments_box(segments)
            dataframe = dataframe[dataframe['timestamp'] <= max_time]
            dataframe = dataframe[dataframe['timestamp'] >= min_time]

        train_augmented = self.preprocessor.get_augmented_data(
            dataframe.index[0],
            dataframe.index[-1],
            segments
        )

        self.model = SupervisedAlgorithm()
        await self.model.fit(train_augmented, confidence)
        if len(segments) > 0:
            last_dataframe_time = dataframe.iloc[-1]['timestamp']
            last_prediction_time = int(last_dataframe_time.timestamp() * 1000)
        else:
            last_prediction_time = 0

        logger.info("Learning is finished for anomaly_name='%s'" % self.anomaly_name)
        return last_prediction_time

    async def predict(self, data):
        logger.info("Start to predict for anomaly type='%s'" % self.anomaly_name)
        last_prediction_time = pd.to_datetime(last_prediction_time, unit='ms')

        start_index = self.data_prov.get_upper_bound(last_prediction_time)
        stop_index = self.data_prov.size()
        last_prediction_time = int(last_prediction_time.value / NANOSECONDS_IN_MS)

        predicted_anomalies = []
        if start_index < stop_index:
            max_chunk_size = 50000
            predicted = pd.Series()
            for index in range(start_index, stop_index, max_chunk_size):
                chunk_start = index
                chunk_finish = min(index + max_chunk_size, stop_index)
                predict_augmented = self.preprocessor.get_augmented_data(chunk_start, chunk_finish)

                assert(len(predict_augmented) == chunk_finish - chunk_start)

                predicted_current = await self.model.predict(predict_augmented)
                predicted = pd.concat([predicted, predicted_current])
            predicted_anomalies = self.preprocessor.inverse_transform_anomalies(predicted)

            last_row = self.data_prov.get_data_range(stop_index - 1, stop_index)

            last_dataframe_time = last_row.iloc[0]['timestamp']
            predicted_anomalies = utils.anomalies_to_timestamp(predicted_anomalies)
            last_prediction_time = int(last_dataframe_time.timestamp() * 1000)

        logger.info("Predicting is finished for anomaly type='%s'" % self.anomaly_name)
        return predicted_anomalies, last_prediction_time
move supervised_algorithm.py -> detectors/general_detector/ folder 6 years ago			`from detectors.general_detector.supervised_algorithm import SupervisedAlgorithm`
One panel - one worker #62 6 years ago			`from detectors import Detector`
reafactor common functions from detectors to utils folder 6 years ago			`import utils`
Add src 7 years ago			`from data_preprocessor import data_preprocessor`
			`import pandas as pd`
			`import logging`
132-proxy-db-queries-through-grafana 7 years ago			`from urllib.parse import urlparse`
folders config++ 7 years ago			`import config`
detectors to folder 6 years ago			`import os.path`
			`import json`
folders config++ 7 years ago
reafactor common functions from detectors to utils folder 6 years ago
Basic creation of analytic unit fails #79 (#86) * Fix * Convert to int 6 years ago			`NANOSECONDS_IN_MS = 1000000`
Add src 7 years ago
			`logger = logging.getLogger('analytic_toolset')`


One panel - one worker #62 6 years ago			`class GeneralDetector(Detector):`
Add src 7 years ago
One panel - one worker #62 6 years ago			`def __init__(self):`
Add src 7 years ago			`self.model = None`

Fix learning (#116) 6 years ago			`async def train(self, dataframe, segments):`
Add src 7 years ago
			`confidence = 0.02`
			`start_index, stop_index = 0, len(dataframe)`
reafactor common functions from detectors to utils folder 6 years ago			`if len(segments) > 0:`
Add src 7 years ago			`confidence = 0.0`
reafactor common functions from detectors to utils folder 6 years ago			`min_time, max_time = utils.segments_box(segments)`
151 fix error on second learning (#5) 7 years ago			`dataframe = dataframe[dataframe['timestamp'] <= max_time]`
			`dataframe = dataframe[dataframe['timestamp'] >= min_time]`
Add src 7 years ago
			`train_augmented = self.preprocessor.get_augmented_data(`
151 fix error on second learning (#5) 7 years ago			`dataframe.index[0],`
			`dataframe.index[-1],`
reafactor common functions from detectors to utils folder 6 years ago			`segments`
Add src 7 years ago			`)`

One panel - one worker #62 6 years ago			`self.model = SupervisedAlgorithm()`
detectors cleanup & jump_detector integration 6 years ago			`await self.model.fit(train_augmented, confidence)`
reafactor common functions from detectors to utils folder 6 years ago			`if len(segments) > 0:`
minor fixes 6 years ago			`last_dataframe_time = dataframe.iloc[-1]['timestamp']`
Add src 7 years ago			`last_prediction_time = int(last_dataframe_time.timestamp() * 1000)`
			`else:`
			`last_prediction_time = 0`

			`logger.info("Learning is finished for anomaly_name='%s'" % self.anomaly_name)`
			`return last_prediction_time`

One panel - one worker #62 6 years ago			`async def predict(self, data):`
Add src 7 years ago			`logger.info("Start to predict for anomaly type='%s'" % self.anomaly_name)`
			`last_prediction_time = pd.to_datetime(last_prediction_time, unit='ms')`

			`start_index = self.data_prov.get_upper_bound(last_prediction_time)`
			`stop_index = self.data_prov.size()`
Basic creation of analytic unit fails #79 (#86) * Fix * Convert to int 6 years ago			`last_prediction_time = int(last_prediction_time.value / NANOSECONDS_IN_MS)`
Add src 7 years ago
			`predicted_anomalies = []`
			`if start_index < stop_index:`
			`max_chunk_size = 50000`
			`predicted = pd.Series()`
			`for index in range(start_index, stop_index, max_chunk_size):`
			`chunk_start = index`
			`chunk_finish = min(index + max_chunk_size, stop_index)`
			`predict_augmented = self.preprocessor.get_augmented_data(chunk_start, chunk_finish)`

			`assert(len(predict_augmented) == chunk_finish - chunk_start)`

asyncio usage (#88) * asyncio integration (buggy) PEAKS_DETECTION doesnt works 6 years ago			`predicted_current = await self.model.predict(predict_augmented)`
Add src 7 years ago			`predicted = pd.concat([predicted, predicted_current])`
			`predicted_anomalies = self.preprocessor.inverse_transform_anomalies(predicted)`

			`last_row = self.data_prov.get_data_range(stop_index - 1, stop_index)`

			`last_dataframe_time = last_row.iloc[0]['timestamp']`
reafactor common functions from detectors to utils folder 6 years ago			`predicted_anomalies = utils.anomalies_to_timestamp(predicted_anomalies)`
Add src 7 years ago			`last_prediction_time = int(last_dataframe_time.timestamp() * 1000)`

			`logger.info("Predicting is finished for anomaly type='%s'" % self.anomaly_name)`
			`return predicted_anomalies, last_prediction_time`