文本分类的机器学习算法

def TextClassification(a):    

    import pandas as pd
    df = pd.read_excel('../Desktop/Stage/Classeur1.xlsx')
    #Removing NULL element
    df=df[pd.notnull(df['RÃ©clamation'])]
    df=df[pd.notnull(df['CatÃ©gorie'])]
 #Removing punctuation 
    df['RÃ©clamation'] = [''.join(c for c in s if c not in string.punctuation) for s in df['RÃ©clamation']]
    df['CatÃ©gorie'] = [''.join(c for c in s if c not in string.punctuation) for s in df['CatÃ©gorie']]
 #Removing Ã© Ã¨ and all numbers
    ch = ['0','1','2','3','4','5','6','7','8','9']

    for c in ch:
                df['RÃ©clamation'] = [w.replace(c, '') for w in df['RÃ©clamation']]
                df['CatÃ©gorie'] = [w.replace(c, '') for w in df['CatÃ©gorie']]


    df['RÃ©clamation']= [w.replace('Ã¨', 'e') for w in df['RÃ©clamation']]
    df['RÃ©clamation']= [w.replace('Ã©', 'e') for w in df['RÃ©clamation']] 
    df['CatÃ©gorie']= [w.replace('Ã¨', 'e') for w in df['CatÃ©gorie']]
    df['CatÃ©gorie']= [w.replace('Ã©', 'e') for w in df['CatÃ©gorie']]


#Lower case
    df['RÃ©clamation']=df['RÃ©clamation'].apply(lambda x: " ".join(x.lower() for x in x.split()))
    df['CatÃ©gorie']=df['CatÃ©gorie'].apply(lambda x: " ".join(x.lower() for x in x.split()))


    df['category_id'] = df['CatÃ©gorie'].factorize()[0]
    category_id_df = df[['CatÃ©gorie', 'category_id']].sort_values('category_id')
    category_to_id = dict(category_id_df.values)
    id_to_category = dict(category_id_df[['category_id', 'CatÃ©gorie']].values)
#library for data preprocessing and maodel building        
    from sklearn.model_selection import train_test_split
    from sklearn.feature_extraction.text import CountVectorizer
    from sklearn.feature_extraction.text import TfidfTransformer
    from sklearn.svm import LinearSVC 
#split data(train/test)    
    X_train, X_test, y_train, y_test = train_test_split(df['RÃ©clamation'], df['CatÃ©gorie'], random_state = 0)
    count_vect = CountVectorizer()
    X_train_counts = count_vect.fit_transform(X_train)
    tfidf_transformer = TfidfTransformer()
    X_train_tfidf = tfidf_transformer.fit_transform(X_train_counts)
    clf = LinearSVC().fit(X_train_tfidf, y_train)
    return(print(clf.predict(count_vect.transform(a)))

如何解决这个问题:我在最后一行的帮助中得到了eof,pb pls在哪里? 什么是EOF?

 File "<ipython-input-25-e6d13da1f205>", line 50
    return(print(clf.predict(count_vect.transform(a)))
                                                      ^
SyntaxError: unexpected EOF while parsing